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Prefacio 


En este libro se presenta un tratamiento entendible sobre el análisis y diseño de sistemas de control 
en tiempo discreto. El libro se escribió para utilizarse como texto para los cursos sobre sistemas de 
control en tiempo discreto o de contro! digital que se imparten ya sea en el último año de licenciatura 
o en el primer año de posgrado para estudiantes de ingeniería. 

En esta segunda edición, parte del material de la primera edición se ha omitido y se añadió 
material nuevo a lo largo del libro. La característica más significativa de esta edición es el tratamien- 
to amplio acerca del diseño mediante ubicación de polos con observadores de orden reducido a 
través del enfoque en el espacio de estados (véase el capítulo 6) y el enfoque de ecuaciones 
polinomiales (véase el capítulo 7). 

En este libro todo el material se presenta de manera que el lector pueda seguir fácilmente todas 
las discusiones. Se incluye la información necesaria para entender los temas que se presentan (tal 
como la prueba de teoremas y los pasos que se siguen para la obtención de las ecuaciones importan- 
tes relacionadas con el diseño de observadores y la ubicación de polos) con el fin de facilitar la 
comprensión de éstos. 

Los antecedentes teóricos para el diseño de sistemas de control se discuten en forma detallada. 
Una vez que se han entendido los aspectos teóricos, el lector puede utilizar ventajosamente MATLAB 
para obtener las soluciones numéricas que involucran varios tipos de operaciones con matrices y 
vectores. Se supone que el lector está familiarizado con el material que se presenta en el libro del 
mismo autor Solving Control Engineering Problems with MATLAB (editado por Prentice-Hall) o su 
equivalente. 

Los requisitos para el lector son un curso introductorio de sistemas de control, un curso sobre 
ecuaciones diferenciales ordinarias y estar familiarizado con MATLAB (si el lector no está familia- 
rizado con MATLAB, éste se puede estudiar paralelamente). 
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Debido a que este libro está escrito desde el punto de vista deingeniería, la presentación del 
material hace énfasis en los conceptos básicos y evita de una manera cuidadosa los desarrollos 
matemáticos complejos. Todo el texto se ha organizado con el fin de presentar la teoría de control en 
tiempo discreto en una forma gradual. 

El libro está organizado en ocho capítulos y tres apéndices. Está formado como sigue: en el 
capítulo 1 se da una introducción a los sistemas de control en tiempo discreto. El capítulo 2 presenta 
la teoría de la transformada z necesaria para el estudio de los sistemas de control en tiempo discreto. 
En el capítulo 3 se discute el análisis en el plano z de los sistemas en tiempo discreto, en el que se 
incluye el muestreo mediante impulsos, la retención de datos, el teorema de muestreo, la función de 
transferencia pulso y los filtros digitales. El capítulo 4 trata el diseño de sistemas de control en tiempo 
discreto mediante métodos convencionales. Este capítulo incluye el análisis de estabilidad de siste- 
mas en lazo cerrado en el plano z, el análisis de las respuestas transitoria y en estado estacionario y el 
diseño basado en el método del lugar geométrico de las raíces, el método de respuesta en frecuencia 
y el método analítico. 

El capítulo 5 presenta el análisis en el espacio de estados, incluyendo la representación 
de sistemas en tiempo discreto en dicho espacio, la matriz de transferencia pulso, un método de 
discretización y el análisis de estabilidad de Liapunov. En el capítulo 6 se discute el diseño por 
ubicación de polos y el diseño de observadores. Este capítulo contiene discusiones sobre 
controlabilidad, observabilidad, ubicación de polos, observadores de estados y sistemas de 
seguimiento. El capítulo 7 trata el enfoque de ecuaciones polinomiales en el diseño de siste- 
mas de control. En este capítulo primero se estudia la ecuación Diofantina y entonces se pre- 
senta el enfoque de ecuaciones polinomiales para el diseño de sistemas de control. Por último, 
se diseñan sistemas de control mediante el acoplamiento a un modelo utilizando el enfoque de 
ecuaciones polinomiales. El capítulo 8 presenta el control óptimo cuadrático. Se estudian los 
problemas de control óptimo cuadrático tanto de dimensión finita como infinita. Este capítulo 
concluye con un problema de diseño basado en el control óptimo cuadrático resuelto con 
MATLAB. 

El apéndice A presenta un resumen del análisis con matrices y vectores. En el apéndice B se 
dan los teoremas útiles de la teoría de la transformada z que no se presentaron en el capítulo 2, el 
método de la integral de inversión y el método de la transformada z modificada. En el apéndice C se 
discute el problema de diseño por ubicación de polos cuando la señal de control es una cantidad 
vectorial. 

Los ejemplos se presentan en puntos estratégicos a lo largo del libro para que el lector tenga un 
mejor entendimiento de los temas que se discuten. Además se proporciona un buen número de 
problemas resueltos (problemas A) al final de cada capítulo, excepto en el capítulo 1. Estos proble- 
mas representan una parte integral del texto. Se sugiere que el lector los estudie cuidadosamente para 
obtener un entendimiento profundo de los temas discutidos. Además, se presentan muchos proble- 
mas propuestos (problemas B) para que se utilicen como tarea o problemas de examen. 

La mayoría del material que se presenta en este libro se ha probado en clases en el último curso 
sobre sistemas de control a nivel licenciatura y el primero a nivel posgrado en la Universidad de 
Minnesota. 

Todo el material de este libro se puede cubrir en dos trimestres. En un curso de un semestre, el 
instructor tendrá cierta flexibilidad para seleccionar los temas a tratar. En un curso trimestral, es 
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posible cubrir una buena parte de los primeros seis capítulos. Este libro también puede servir para 
ingenieros que deseen estudiar la teoría de control en tiempo discreto. 

Se debe dar reconocimiento a mis exalumnos, quienes resolvieron todos los problemas resuel- 
tos (problemas A) y los problemas propuestos (problemas B) e hicieron un buen número de comen- 
tarios constructivos acerca del material contenido en este libro. 


Katsuhiko Ogata 
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Introducción a los 
sistemas de control 
en tiempo discreto 














1-1 INTRODUCCIÓN 


En años recientes se ha incrementado el uso de controladores digitales en sistemas de control. Los 
controladores digitales se utilizan para alcanzar el desempeño óptimo —por ejemplo, en la forma de 
productividad máxima, beneficio máximo, costo mínimo o la utilización mínima de energía. 

Recientemente, la aplicación de control por computadora ha hecho posible el movimiento 
“inteligente” en robots industriales, la optimización de economía de combustible en automóviles y el 
refinamiento en la operación de enseres y máquinas de uso doméstico, tales como hornos de microondas 
y máquinas de coser, entre otros. La capacidad en la toma de decisiones y la flexibilidad en los 
programas de control son las mayores ventajas de los sistemas de control digital. 

La tendencia actual de controlar los sistemas dinámicos en forma digital en lugar de analógica, 
se debe principalmente a la disponibilidad de computadoras digitales de bajo costo y a las ventajas 
de trabajar con señales digitales en lugar de señales en tiempo continuo. 


Tipos de señales. Una señal en tiempo continuo es aquella que se define sobre un intervalo 
continuo de tiempo. La amplitud puede tener un intervalo continuo de valores o solamente un núme- 
ro finito de valores distintos. El proceso de representar una variable por medio de un conjunto de 
valores distintos se denomina cuantificación y los valores distintos resultantes se denominan valores 
cuantificados. La variable cuantificada sólo cambia en un conjunto finito de valores distintos. 

Una señal analógica es una señal definida en un intervalo continuo de tiempo cuya amplitud 
puede adoptar un intervalo continuo de valores. La figura l-la) muestra una señal analógica en 
tiempo continuo y la figura 1-16) una señal cuantificada en tiempo continuo (cuantificada sólo en 
amplitud). 
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x(t) 
a) É ` 
0 t 
xit) 
b) | 
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c} | | | | 
0 t 
x(t) 
Figura 1-1 a) Señal analógica en tiempo continuo; b) 
señal cuantificada en tiempo continuo; c) señal de datos 
o i muestreados; d) señal digital. 


Observe que la señal analógica es un caso especial de la señal en tiempo continuo. En la 
práctica, sin embargo, se emplea con frecuencia la terminología “tiempo continuo” en lugar de 
“analógica”. De esta forma, en la literatura, incluyendo este libro, los términos “señal en tiempo 
continuo” y “señal analógica” se intercambian de manera frecuente, aunque estrictamente hablando 
no son del todo sinónimos. 

Una señal en tiempo discreto es una señal definida sólo en valores discretos de tiempo (esto es, 
aquellos en los que la variable independiente f está cuantificada). En una señal en tiempo discreto, si 
la amplitud puede adoptar valores en un intervalo continuo, entonces la señal se denomina señal de 
datos muestreados. Una señal de datos muestreados se puede generar muestreando una señal analógica 
en valores discretos de tiempo. Ésta es una señal de pulsos modulada en amplitud. La figura 1-1c) 
muestra una señal de datos muestreados. 

Una señal digital es una señal en tiempo discreto con amplitud cuantificada. Dicha señal se 
puede representar mediante una secuencia de números, por ejemplo, en la forma de números binarios. 
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(En la práctica, muchas señales digitales se obtienen mediante el muestreo de señales analógicas que 
después se cuantifican; la cuantificación es lo que permite que estas señales analógicas sean leidas 
como palabras binarias finitas.) La figura 1-1d) muestra una señal digital. Es claro que está cuantifica- 
da tanto en amplitud como en tiempo. El uso de un controlador digital requiere de la cuantificación de 
las señales tanto en amplitud como en tiempo. 

El término “señal en tiempo discreto” es más general que el término “señal digital” o que el 
término “señal de datos muestreados”. De hecho, una señal en tiempo discreto se puede referir ya sea 
a una señal digital o a una señal de datos muestreados. En la práctica, los términos “tiempo discreto” 
y “digital” a menudo se intercambian. Sin embargo, el término “tiempo discreto” se emplea en el 
estudio teórico, mientras que el término “digital” se utiliza en conexión con las realizaciones de 
hardware o software. 

En ingeniería de control, el objeto controlado es una planta o proceso. Éste podría ser una 
planta o proceso físico o un proceso no físico como un proceso económico. La mayoría de las plantas 
o procesos físicos involucran señales en tiempo continuo; por lo tanto, si los sistemas de control 
incluyen controladores digitales, se hace necesaria la conversión de señales (de analógico a digital y 
de digital a analógico). Existen técnicas estándar para realizar dichas conversiones de señales; las 
que se estudiarán en la sección 1-4. 

Hablando con cierta holgura, los términos como sistemas de control en tiempo discreto, siste- 
mas de control de datos muestreados y control digital implican el mismo tipo o tipos muy similares 
de sistemas de control. Hablando en forma precisa, por supuesto que hay diferencias en estos siste- 
mas. Por ejemplo, en un sistema de control de datos muestreados existen tanto señales en tiempo 
continuo como en tiempo discreto: las señales en tiempo discreto están moduladas en amplitud por 
una señal de pulsos. Los sistemas de control digital pueden incluir tanto señales en tiempo continuo 
como en tiempo discreto; donde las señales en tiempo discreto están codificadas en forma numérica. 
Los sistemas de control de datos muestreados y los digitales son sistemas de control en tiempo 
discreto. 

Muchos sistemas de control industrial incluyen señales en tiempo continuo, señales de datos 
muestreados y señales digitales. Por lo tanto, en este libro se utiliza el término “sistemas de control 
en tiempo discreto” para describir los sistemas de control que incluyen alguna de las formas de 
señales de datos muestreados (señales de pulsos moduladas en amplitud) y/o señales digitales (seña- 
les codificadas en forma numérica). 


Sistemas que se tratan en este libro. Los sistemas de control en tiempo discreto que se 
consideran en este libro son en su mayoría lineales e invariables en el tiempo, aunque Ocasionalmen- 
te se incluyen en las discusiones sistemas no lineales y/o variantes en el tiempo. Un sistema lineal es 
aquel en el que se satisface el principio de superposición. De esta manera, si y, es la respuesta del 
sistema a la entrada x,, y y, es la respuesta a la entrada x,, entonces el sistema es lineal si y sólo si, para 
cualesquiera escalares œ y f, la respuesta a la entrada ax, + Bx, es ay, + By». 

Un sistema lineal se puede describir mediante ecuaciones diferenciales o en diferencias linea- 
les. Un sistema lineal e invariable en el tiempo es aquel en el que los coeficientes en la ecuación 
diferencial o en diferencias no varían con el tiempo, esto es, es aquel sistema cuyas propiedades no 
cambian con el tiempo. 


Sistemas de control en tiempo continuo y en tiempo discreto. Los sistemas de control en 
tiempo discreto son aquellos sistemas en los cuales una o más de las variables pueden cambiar solo 
en valores api de tiempo. Estos instantes, los que se denotarán mediante ÁT o 4 (k= 0. 1.2... 
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pueden especificar los tiempos en los que se lleva a cabo alguna medición de tipo físico o los tiempos 
en los que se extraen los datos de la memoria de una computadora digital. El intervalo de tiempo entre 
estos dos instantes discretos se supone que es lo suficientemente corto de modo que el dato para el 
tiempo entre éstos se pueda aproximar mediante una interpolación sencilla, 

Los sistemas de control en tiempo discreto difieren de los sistemas de control en tiempo con- 
tinuo en que las señales para los primeros están en la forma de datos muestreados o en la forma 
digital. Si en el sistema de control está involucrada una computadora digital como un controlador, 
los datos muestreados se deben convertir a datos digitales. 

Los sistemas en tiempo continuo, cuyas señales son continuas en el tiempo, se pueden descri- 
bir mediante ecuaciones diferenciales. Los sistemas en tiempo discreto, los cuales involucran seña- 
les de datos muestreados o señales digitales y posiblemente señales en tiempo continuo, también se 
pueden describir mediante ecuaciones en diferencias después de la apropiada discretización de las 
señales en tiempo continuo. 


Proceso de muestreo. El muestreo de señales en tiempo continuo reemplaza la señal en 
tiempo continuo por una secuencia de valores en puntos discretos de tiempo. El proceso de muestreo 
se emplea siempre que un sistema de control involucra un controlador digital, puesto que son nece- 
sarias una operación de muestreo y una de cuantificación para ingresar datos a ese controlador. 
También, se da un proceso de muestreo cuando las mediciones necesarias para control se obtienen en 
forma intermitente. Por ejemplo, en el sistema de seguimiento por radar, a medida que la antena del 
radar gira, la información acerca del azimut y de la elevación se obtiene una vez por cada vuelta que 
da la antena. De este modo, la operación de rastreo del radar produce un dato muestreado. En otro 
ejemplo, el proceso de muestreo se necesita cuando un controlador o computadora de gran tamaño 
se comparte en tiempo entre varias plantas con el fin de reducir los costos. En este caso se envía 
periódicamente una señal de control para cada una de las plantas y de esta manera la señal se con- 
vierte en una de datos muestreados. 

El proceso de muestreo es seguido por un proceso de cuantificación. En el proceso de 
cuantificación, la amplitud analógica muestreada se reemplaza por una amplitud digital (representada 
mediante un número binario). Entonces la señal digital se procesa por medio de la computadora. La 
salida de la computadora es una señal muestreada que se alimenta a un circuito de retención. La salida 
del circuito de retención es una señal en tiempo continuo que se alimenta al actuador. En la sección 1- 
4 se presentarán los detalles para dichos métodos de procesamiento de señales en el controlador 
digital. 

El término “discretización” en lugar de “muestreo” se utiliza con frecuencia en el análisis de 
sistemas con entradas y salidas múltiples, aunque ambos significan básicamente lo mismo. 

Es importante observar que de manera ocasional la operación de muestreo o discretización es 
enteramente ficticia y se ha introducido sólo para simplificar el análisis de los sistemas de control 
que en realidad sólo contienen señales en tiempo continuo. De hecho, a menudo se utiliza un modelo 
en tiempo discreto apropiado para un sistema en tiempo continuo. Un ejemplo es la simulación en 
una computadora digital de un sistema en tiempo continuo. Dicho sistema simulado en una 
computadora digital se puede analizar para obtener los parámetros que optimizan un índice de des- 
empeño dado. 

La mayor parte del material que se presenta en este libro trata con sistemas de control que se 
pueden modelar como sistemas en tiempo discreto, lineales e invariables en el tiempo. Es importante 
mencionar que muchos sistemas de control digital están basados en técnicas de diseño en tiempo 
continuo. Debido a que se ha acumulado una gran riqueza en lo que a experiencia se refiere en el 
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diseño de controladores en tiempo continuo, el conocimiento pleno de estas técnicas es muy valioso 
en el diseño de sistemas de control en tiempo discreto. 


1-2 SISTEMAS DE CONTROL DIGITAL 


En la figura 1-2 se muestra un diagrama de bloques de un sistema de control digital que presenta la 
configuración del esquema de control básico. En el sistema se incluye el control realimentado y el 
prealimentado. En el diseño de dicho sistema de control, se deberá observar que la “bondad” del 
sistema de control depende de circunstancias individuales. Se requiere elegir un índice de desempe- 
ño apropiado para un caso dado y diseñar un controlador de modo que optimice el índice de desem- 
peño elegido. 


Formas de las señales en un sistema de control digital. La figura 1-3 muestra un diagrama 
de bloques de un sistema de control digital. Los elementos básicos del sistema se muestran mediante 
los bloques. La operación del controlador se maneja por el reloj. En dicho sistema de control digital, 
en algunos puntos del sistema pasan señales de amplitud variable ya sea en tiempo continuo o en 
tiempo discreto, mientras que en otros pasan señales codificadas en forma numérica, como se mues- 
tra en la figura. 

La salida de la planta es una señal en tiempo continuo. La señal de error se convierte a forma 
digital mediante el circuito de muestreo y retención y el convertidor analógico-digital. La conver- 
sión se hace en el tiempo de muestreo. La computadora digital procesa las secuencias de números 
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Figura 1-2 Diagrama de bloques de un sistema de control digital. 
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Figura 1-3 Diagrama de bloques de un sistema de control digital que muestra las señales en forma binaria o gráfica. 


por medio de un algoritmo y produce nuevas secuencias de números. En cada instante de muestreo se 
debe convertir un número codificado (en general un número binario que consiste en ocho o más 
dígitos binarios) en una señal física de control, la cual normalmente es una señal en tiempo continuo 
o analógica. El convertidor digital-analógico y el circuito de retención convierten la secuencia de 
números en código numérico a una señal continua por secciones. El reloj en tiempo real de la 
computadora sincroniza los eventos. La salida del circuito de retención, una señal en tiempo continuo, 
se alimenta a la planta, ya sea de manera directa o a través de un actuador, para controlar su dinámica. 

La operación que transforma las señales en tiempo continuo en datos en tiempo discreto se 
denomina muestreo o discretización. La operación inversa, que transforma datos en tiempo discreto 
en una señal en tiempo continuo, se conoce como retención de datos; ésta realiza la reconstrucción 
de la señal en tiempo continuo a partir de la secuencia de datos en tiempo discreto. Esto por lo 
regular se logra al utilizar alguna de las muchas técnicas de extrapolación. En la mayoría de los casos 
esto se realiza manteniendo constante la señal entre los instantes de muestreo sucesivos. (Dichas 
técnicas de extrapolación se estudiarán en la sección 1-4.) 

El circuito de muestreo y retención (S/H, del inglés Sample-and-Hold) y el convertidor 
analógico-digital (A/D) convierten la señal en tiempo continuo en una secuencia de palabras binarias 
codificadas numéricamente. Dicho proceso de conversión A/D se conoce como codificación. La 
combinación del circuito S/H y el convertidor analógico-digital se puede visualizar como un inte- 
rruptor que cierra instantáneamente en cada intervalo de tiempo T y genera una secuencia de núme- 
ros en código numérico. La computadora digital procesa dichos números en código numérico y 
genera una secuencia deseada de números en código numérico. El proceso de conversión digital- 
analógico (D/A) se denomina decodificación. 


Definición de términos. Antes de estudiar los sistemas de control digital en detalle, se nece- 
sitan definir algunos de los términos que aparecen en el diagrama de bloques de la figura 1-3. 


Muestreador y retenedor (S/H). “Muestreador y retenedor” es un término general que se 
utiliza para un amplificador de muestreo y retención. Este término describe un circuito que recibe 
como entrada una señal analógica y mantiene dicha señal en un valor constante durante un tiempo 
específico. Normalmente la señal es eléctrica, pero son posibles otras formas de ésta, tales como 
óptica o mecánica. 

N 
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Convertidor analógico-digital (A/D). Un convertidor analógico-digital, también conocido 
como codificador, es un dispositivo que convierte una señal analógica en una señal digital, usualmen- 
te una señal codificada numéricamente. Dicho convertidor se necesita como una interfaz entre un 
componente analógico y uno digital. Con frecuencia un circuito de muestreo y retención es una parte 
integral de un convertidor A/D disponible comercialmente. La conversión de una señal analógica en 
la señal digital correspondiente (número binario) es una aproximación, ya que la señal analógica 
puede adoptar un número infinito de valores, mientras que la variedad de números diferentes que se 
pueden formar mediante un conjunto finito de dígitos está limitada. Este proceso de aproximación se 
denomina cuantificación. (En la sección 1-3 se presenta más información acerca de la cuantificación.) 


Convertidor digital-analógico (D/A). Un convertidor digital-analógico, también denomina- 
do decodificador, es un dispositivo que convierte una señal digital (datos codificados numéricamen- 
te) en una señal analógica. Dicho convertidor es necesario como una interfaz entre un componente 
digital y uno analógico. 


Planta o proceso. Una planta es cualquier objeto físico a ser controlado. Como ejemplos se 
tienen un horno, un reactor químico y un conjunto de partes de maquinaria que funcionan de manera 
conjunta para llevar a cabo una operación particular, tal como un sistema de seguimiento o una nave 
espacial. 

En general, un proceso se define como una operación progresiva o un desarrollo marcado 
mediante una serie de cambios graduales que suceden uno a otro de una manera relativamente fija y 
conducen hacia un resultado o fin determinado. En este libro se denomina proceso a cualquier opera- 
ción a ser controlada. Como ejemplos se pueden citar procesos químicos, económicos y biológicos. 

La parte más difícil en el diseño de sistemas de control puede situarse en el modelado preciso 
de una planta o proceso físico. Existen muchos enfoques para obtener el modelo de una planta o 
proceso pero, aun así, pueden existir dificultades, debido principalmente a la falta de precisión en la 
dinámica del proceso y a la pobre definición de parámetros aleatorios en muchas plantas o procesos 
físicos. Por tanto, en el diseño de un controlador digital, es necesario reconocer el hecho de que el 
modelo matemático de una planta o proceso en muchos casos es sólo una aproximación del proceso 
físico. Existen algunas excepciones en el modelado de sistemas electromecánicos y sistemas hidraúlico- 
mecánicos (hidromecánicos), puesto que éstos se pueden modelar de manera precisa. Por ejemplo, el 
modelado de un sistema de un brazo manipulador (robot) se puede llevar a cabo con una gran precisión. 


Transductor. Un transductor es un dispositivo que convierte una señal de entrada en una 
señal de salida de naturaleza diferente a la de entrada, tal como los dispositivos que convierten una se- 
ñal de presión en una salida de voltaje. En general, la señal de salida depende de la historia de la 
entrada. 

Los transductores se pueden clasificar como transductores analógicos, transductores de datos 
muestreados o transductores digitales. Un transductor analógico es aquel en que las señales de entra- 
da y salida son funciones continuas del tiempo. Las magnitudes de estas señales pueden tomar cual- 
quier valor dentro*de las limitaciones físicas del sistema. Un transductor de datos muestreados es 
aquel en el que las señales de entrada y salida se presentan en valores discretos de tiempo (normal- 
mente periódicos), pero las magnitudes de las señales, como en el caso de los transductores analógicos. 
no están cuantificadas. Un transductor digital es aquel en el que las señales de entrada y salida se 
presentan sólo en valores discretos de tiempo y las magnitudes de las señales están cuantificadas 
(esto es, solamente pueden adoptar ciertos valores discretos). 


rr 
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Tipos de operaciones de muestreo. Como se estableció antes, una señal cuya variable inde- 
pendiente £ es discreta se denomina señal en tiempo discreto. Una operación de muestreo es básica- 
mente la transformación de una señal en tiempo continuo en una en tiempo discreto. 

Existen diferentes tipos de operaciones de muestreo de importancia práctica: 


1. Muestreo periódico. En este caso, los instantes de muestreo están espaciados de manera uni- 
forme, o 4 = AT (k=0, 1,2,.. .). El muestreo periódico es el tipo más convencional de las 
operaciones de muestreo. 

2. Muestreo de orden múltiple. El patrón de los 1, se repite periódicamente; esto es, f, ,,— t, es 
constante para todo k. 

3. Muestreo de tasa múltiple, En un sistema de control que tiene lazos múltiples, la mayor cons- 
tante de tiempo involucrada en un lazo puede diferir en gran medida de las de los otros lazos. 
Por lo tanto, puede ser aconsejable muestrear lentamente en un lazo que involucre una cons- 
tante de tiempo grande, mientras que en un lazo que involucre constantes de tiempo pequeñas 
la tasa de muestreo debe ser más rápida. De esta manera, un sistema de control digital puede 
tener diferentes períodos de muestreo en diferentes trayectorias de realimentación o bien tasas 
de muestreo múltiples. 

4. Muestreo aleatorio, En este caso, los instantes de muestreo son aleatorios, o f, es una variable 
aleatoria. 


En este libro se tratará sólo el caso donde el muestreo es periódico. 


1-3 CUANTIFICACIÓN Y ERRORES DE CUANTIFICACIÓN 


Las principales funciones involucradas en la conversión analógico-digital son el muestreo, la 
cuantificación de la amplitud y la codificación. Cuando el valor de cualquier muestra cae entre dos 
estados de salida adyacentes “permitidos”, se debe leer como el estado de salida permitido más 
cercano al valor real de la señal. El proceso de representación de una señal continua o analógica 
mediante un número finito de estados discretos se denomina cuantificación de la amplitud. Esto es, 
“cuantificación” significa la transformación de una señal continua o analógica en un conjunto de 
estados discretos. (Observe que la cuantificación se presenta cuando una cantidad física se represen- 
ta en forma numérica.) 

El estado de salida de cualquier muestra cuantificada se describe entonces mediante un código 
numérico. El proceso de representar el valor de una muestra mediante un código numérico (tal como 
el código binario) se denomina codificación. De este modo, la codificación es el proceso de asigna- 
ción de una palabra o código digital a cada uno de los estados discretos. El período de muestreo y los 
niveles de cuantificación afectan el desempeño de los sistemas de control digital. De manera que 
éstos se deben determinar cuidadosamente. 


Cuantificación. El sistema numérico estándar utilizado para el procesamiento de señales 
digitales es el sistema binario. En N sistema numérico el grupo de códigos consisten en » pulsos 
cada uno de los cuales indica ya sea “encendido” (1) o “apagado” (0). En el caso de la cuantificación, 
los n pulsos “encendido-apagado” pueden representar 2” niveles de amplitud o estados de salida. 

El nivel de cuantificación Q se define como el intervalo entre dos puntos adyacentes de deci- 
sión y está dado mediante 
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FSR 
Q a 2r 





donde FSR es el intervalo a escala completa. Observe que el bit que está más a la izquierda del 
código binario natural tiene el mayor peso (un medio de la escala completa) y se le conoce como el 
bit más significativo (MSB). El bit que está más a la derecha tiene el menor peso (1/2” veces la escala 
completa) y se le conoce como el bit menos significativo (LSB). De esta manera, 
FSR 
LSB = E 


El bit menos significativo es el nivel de cuantificación Q. 


Error de cuantificación. Puesto que el número de bits en la palabra digital es finito, la 
conversión A/D da como resultado una resolución finita. Esto es, la salida digital puede solamente 
adoptar un número finito de niveles, y por lo tanto un número analógico se debe redondear al nivel 
digital más cercano. Por consiguiente, toda conversión A/D involucra un error de cuantificación. 
Dicho error de cuantificación varía entre 0 y +7 Q. Este error depende de la fineza del nivel de cuan- 
tificación y se puede hacer tan pequeño como se desee haciendo más pequeño el nivel de cuantificación 
(esto es, al incrementar el número 7 de bits). En la práctica, existe un máximo para el número n de bits, 
y de este modo siempre existe algún error debido a la cuantificación. La incertidumbre presente en el 
proceso de cuantificación se conoce como ruido de cuantificación. 

Para determinar el tamaño deseado del nivel de cuantificación (o número de estados de salida) 
en un sistema de contro! digital dado, el ingeniero debe tener un buen entendimiento entre el tamaño 
del nivel de cuantificación y el error resultante. La varianza del ruido de cuantificación es una medi- 
da del error de cuantificación, puesto que ésta es proporcional a la potencia promedio asociada con 
el ruido. 

En la figura 1-4a) se muestra un diagrama de bloques de un cuantificador junto con sus carac- 
terísticas entrada-salida. Para una entrada analógica x(2), la salida y(£) toma sólo un número finito de 
niveles, los cuales son múltiplos enteros del nivel de cuantificación O. 

En el análisis numérico, el error resultante de despreciar los dígitos remanentes se denomina 
error de redondeo. Debido a que el proceso de cuantificación es un proceso de aproximación en el 
que la cantidad analógica se aproxima mediante un número digital finito, el error de cuantificación 
es un error de redondeo. Es claro que, mientras más fino sea el nivel de cuantificación, más pequeño 
será el error de redondeo. 

En la figura 1-4b) se muestra una entrada analógica x(1) y la salida discreta y(2), la cual está en 
la forma de una función escalonada. El error de cuantificación e(r) es la diferencia entre la señal de 
entrada y la salida cuantificada, o 





e(t) = x(t) — y(t) 
| 
Observe què la magnitud del error cuantificado es 


0 = jel =30 


Para un nivel de cuantificación pequeño Q, la naturaleza del error de cuantificación es similar 
a la del ruido aleatorio. Y, en efecto, el proceso de cuantificación actúa como una fuente de ruido 
aleatorio. A continuación se obtendrá la varianza del ruido de cuantificación. Dicha varianza se 
puede obtener en términos del nivel de cuantificación Q. 
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Figura 1-4 a) Diagrama de bloques de un cuantificador y sus caracteristicas entrada-salida; 
b) entrada analógica x(1) y salida discreta y(1); c) distribución de probabilidad P(e) del error de 
cuantificación e. 


Suponga que el nivel de cuantificación Q es pequeño y que también el error de cuantificación 
e(t) se distribuye uniformemente entre —+ Q y +0 y que este error actúa como un ruido blanco. [Esto 
es de manera obvia una suposición un tanto áspera. Sin embargo, debido a que la señal de error de 
cuantificación e(t) es de una amplitud pequeña, esta suposición podría ser aceptable como una 
aproximación de primer orden.] La distribución de probabilidad P(e) de la señal e(r) puede graficarse 
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como se muestra en la figura 1-4c). El valor promedio de e(£) es cero, o e(f) = 0. Entonces la varianza o” 

del ruido de cuantificación es 

on o? 
2d = 2 

Ade 


0? = Ele(1) - OT = 5 


De esta manera, si el nivel de cuantificación O es pequeño comparado con la amplitud promedio de la 
señal de entrada, entonces la varianza del ruido de cuantificación es un doceavo del cuadrado del 
nivel de cuantificación. 


1-4 SISTEMAS DE ADQUISICIÓN, CONVERSIÓN Y DISTRIBUCIÓN DE DATOS 


Con el crecimiento rápido en el uso de computadoras digitales para ejecutar las acciones de un 
control digital, tanto los sistemas de adquisición de datos como los de distribución se han convertido 
en una parte importante de todo sistema de control. 

La conversión de señales que tiene lugar en el sistema de control digital involucra las siguien- 
tes operaciones: 


Multiplexación y demultiplexación 

Muestreo y retención 

Conversión analógico-digital (cuantificación y codificación) 
Conversión digital-analógico (decodificación) 


A 


En la figura 1-S5a) se muestra el diagrama de bloques de un sistema de adquisición de datos y en la 
figura 1-55) se muestra un diagrama de bloques de un sistema de distribución de datos. 

En el sistema de adquisición de datos, la entrada al sistema es una variable fisica tal como 
posición, velocidad, aceleración, temperatura o presión. Dichas variables físicas primero se convier- 
ten en una señal eléctrica (una señal de voltaje o corriente) mediante un transductor apropiado, Una 


Variable 
PARN Transductor Ampliticador Filtro Multiplexor Muestreador Convertidor Al controlador 
se. paso-bajas analógico y retenedor AD Agial 


Del controlador Convertidor 
ai Regisiro Demultiplexor Es Retenedo: Al actuador 


b) 


Figura H-5 a) Diagrama de bloques de un sistema de adquisición de datos: b) diagrama de bloques de un sistema de 
distribución de datos. 
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vez que la variable física se convierte en una señal de voltaje o corriente, el resto del proceso de 
adquisición de datos se hace por medios electrónicos. 

En la figura 1-5a) el amplificador que sigue del transductor (frecuentemente un amplificador 
operacional) ejecuta una o más de las siguientes funciones: amplificar el voltaje de salida del transductor; 
convertir la señal de corriente en una de voltaje; o aislar la señal. El filtro paso-bajas que sigue al 
amplificador atenúa las componentes de alta frecuencia de la señal, tales como señales de ruido. 
(Observe que los ruidos de tipo electrónico son de naturaleza aleatoria y se pueden reducir mediante 
filtros paso-bajas. Sin embargo, dichos ruidos de tipo electrónico, como la interferencia de la línea de 
alimentación, generalmente son periódicos y se pueden reducir por medio de filtros de muesca.) La 
salida del filtro paso-bajas es una señal analógica. Esta señal se alimenta a un multiplexor analógico. 
La salida del multiplexor se alimenta al circuito de muestreo y retención, cuya salida, a su vez, se 
alimenta al convertidor analógico-digital. La salida del convertidor es la señal en forma digital; ésta se 
alimenta al controlador digital. 

El proceso inverso al de adquisición de datos es el de distribución de datos. Como se muestra 
en la figura 1-5b), un sistema de distribución de datos consiste en registros, un demultiplexor, conver- 
tidores digital-analógico y circuitos de retención. Este sistema convierte la señal en forma digital 
(números binarios) en otra en forma analógica. La salida del convertidor D/A se alimenta al circuito de 
retención. La salida del circuito de retención se alimenta al actuador analógico, el cual, a su vez, 
controla directamente la planta que se está considerando, 

A continuación, se estudiará cada componente individual involucrado en el sistema de proce- 
samiento de la señal. 


Multiplexor analógico. Un convertidor analógico-digital es el componente más costoso en 
un sistema de adquisición de datos. El multiplexor analógico es un dispositivo que lleva a cabo la 
función de compartir en tiempo un convertidor A/D entre muchos canales analógicos. El procesa- 
miento de varios canales con un controlador digital es posible debido a que el ancho de cada uno de 
los pulsos que representa a la señal de entrada es muy angosto, de manera que el espacio vacío 
durante cada período de muestreo se puede utilizar para otras señales. Si se van a procesar muchas 
señales por un solo controlador digital, entonces estas señales de entrada se deben alimentar al 
controlador a través de un multiplexor. 

En la figura 1-6 se muestra un diagrama de un multiplexor analógico. El multiplexor analógico 







Al muestreador 


Canales de entrada 


Figura 1-6 Diagrama esquemático de un 
multiplexor analógico. 


Secuenciador 
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es un interruptor múltiple (normalmente un interruptor electrónico) que conmuta secuencialmente 
entre muchos canales de entrada analógicos en alguna forma preestablecida. El número de canales, en 
muchas instancias, es 4, 8 o 16. En un instante dado, sólo un interruptor está en la posición de 
“encendido”. Cuando el interruptor está encendido en un canal de entrada dado, la señal de entrada 
se conecta a la salida del multiplexor durante un tiempo específico. Durante el tiempo de conexión, el 
circuito de muestreo y retención muestrea a la señal de voltaje (señal analógica) y retiene su valor, 
mientras que el convertidor analógico-digital convierte el valor analógico en datos digitales (números 
binarios). Cada uno de los canales se lee en orden secuencial y los valores correspondientes se 
convierten en datos digitales en la misma secuencia. 


Demultiplexor. El demultiplexor, el cual está sincronizado con la señal de muestreo de en- 
trada, separa los datos digitales de la salida compuesta, del controlador digital en los canales origina- 
les. Cada uno de los canales está conectado a un convertidor D/A para producir la señal de salida 
analógica para ese canal. 


Circuitos de muestreo y retención. Un muestreador en un sistema digital convierte una se- 
ñal analógica en un tren de pulsos de amplitud modulada. El circuito de retención mantiene el valor 
del pulso de la señal muestreada durante un tiempo específico. El muestreador y el retenedor son 
necesarios en el convertidor A/D para producir un número que represente de manera precisa la señal 
de entrada en el instante de muestreo. Existen de manera comercial circuitos de muestreo y retención 
en una sola unidad, conocidos como muestreador y retenedor (S/H). Sin embargo, matemáticamen- 
te, las operaciones de muestreo y la de retención se modelan por separado (véase la sección 3-2). Es 
una práctica común utilizar un solo convertidor analógico-digital y multiplexar muchas entradas 
analógicas muestreadas en éste. 

En la práctica, la duración del muestreo es muy corta comparada con el período de muestreo 7. 
Cuando la duración del muestreo es despreciable, el muestreador se puede considerar como un 
“muestreador ideal”. Un muestreador ideal lo habilita a uno para obtener un modelo matemático 
relativamente simple de un muestreador y retenedor. (Dicho modelo matemático se discutirá con 
detalle en la sección 3-2.) 

En la figura 1-7 se muestra un diagrama simplificado para el muestreador y retenedor. El 
circuito S/H es un circuito analógico (simplemente un dispositivo de memoria de voltaje) en el que 
se adquiere una entrada de voltaje y entonces se almacena en un capacitor de alta calidad con carac- 
terísticas de fuga y absorción dieléctrica bajas. 

En la figura 1-7 el interruptor electrónico se conecta al capacitor de retención. El amplificador 
operacional 1 es un amplificador de aislamiento de entrada con una impedancia de entrada alta. El 
amplificador operacional 2 es el amplificador de salida; éste aísla el voltaje en el capacitor de reten- 
ción. 

Existen dos modos de operación para el circuito de muestreo y retención: el modo de segui- 
miento y el de retención. Cuando el interruptor está cerrado (esto es, cuando la señal de entrada está 
conectada), el modo de operación es el de seguimiento. La carga en el capacitor en el circuito sigue 
al voltaje de entrada. Cuando el interruptor está abierto (la señal de entrada está desconectada), el 
modo de operación es el de retención y el voltaje del capacitor se mantiene constante por un tiempo 
específico. La figura 1-8 muestra los modos de seguimiento y de retención. 

Observe que, de manera práctica, la conmutación del modo de seguimiento al de retención no 
es instantáneo. Si se da el comando de retención mientras el circuito está en el modo de seguimiento. 
entonces el circuito permanecerá en el modo de seguimiento por un momento antes de reaccionar ante 
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Figura 1-7 Circuito de muestreo y retención. 


el comando de retención. El intervalo de tiempo durante el cual la conmutación tiene lugar (esto es, el 
intervalo de tiempo cuando la amplitud medida es incierta) se denomina tiempo de apertura. 

El voltaje de salida durante el modo de retención puede decrecer ligeramente. La caída del 
modo de retención se puede reducir mediante el uso de un amplificador de aislamiento de salida con 
una impedancia de entrada alta. Dicho amplificador de aislamiento de salida debe tener una corrien- 
te de polarización muy baja. 

La operación de muestreo y retención está controlada por un reloj. 


Tipos de convertidores analógico-digital (A/D). Como se estableció en un principio, el pro- 
ceso mediante el cual una señal analógica muestreada se cuantifica y se convierte en un número 
binario es conocido como conversión analógico-digital. De esta manera, un convertidor A/D trans- 
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forma una señal analógica (por lo general en la forma de voltaje o corriente) en una señal digital o una 
palabra codificada numéricamente. En la práctica, la lógica está basada en dígitos binarios compues- 
tos por Os y 1s, y la representación tiene un número finito de dígitos. El convertidor A/D ejecuta las 
operaciones de muestreo y retención, cuantificación y codificación. Observe que en el sistema digital 
un reloj genera un pulso cada período de muestreo 7. El convertidor A/D envía una señal digital 
(número binario) al controlador digital cada vez que el pulso llega. 

Entre los circuitos A/D disponibles, los siguientes tipos son los más frecuentemente utilizados: 


Del tipo de aproximaciones sucesivas 
Del tipo de integración 

Del tipo contador 

Del tipo paralelo 


PO 


Cada uno de estos cuatro tipos tiene sus propias ventajas y desventajas. En cualquier aplicación 
particular, la velocidad de conversión, precisión, longitud de palabra y el costo son los principales 
factores a considerar en la elección del tipo de convertidor A/D. (Si se requiere de una mayor preci- 
sión, por ejemplo, se debe incrementar el número de bits en la señal de salida.) 

Como se verá, el convertidor analógico-digital utiliza como parte de sus lazos de realimentación 
convertidores digital-analógico. El tipo más sencillo de convertidor A/D es el del tipo contador. Su 
principio básico es que se aplican los pulsos de reloj al contador digital de manera que el voltaje de 
salida del convertidor D/A (esto es, parte del lazo de realimentación del convertidor A/D) aumente 
un bit menos significativo (LSB) cada vez, y el voltaje de salida se compara con el voltaje analógico 
de entrada una vez por cada pulso. Cuando el voltaje de salida ha alcanzado la magnitud del voltaje 
de entrada, los pulsos de reloj se detienen. El voltaje de salida del contador es entonces la salida 
digital. 

El convertidor A/D del tipo de aproximaciones sucesivas es mucho más rápido que el del tipo 
contador y es el utilizado con mayor frecuencia. En la figura 1-9 se muestra un diagrama del conver- 
tidor A/D del tipo de aproximaciones sucesivas. 
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Figura 1-9 Diagrama esquemático de un convertidor A/D del tipo de aproximaciones sucesivas. 
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El principio de operación de este tipo de convertidor A/D es el que sigue. El registro de aproxi- 
maciones sucesivas (SAR) primero enciende el bit más significativo (la mitad del máximo) y lo compara 
con la entrada analógica. El comparador decide ya sea dejar encendido este bit o apagarlo. Si el voltaje 
de entrada analógico es mayor, el bit más significativo permanece encendido. El siguiente paso es 
encender el bit 2 y entonces compararlo con los tres cuartos del máximo del voltaje analógico de 
entrada. Después de que se completan las n comparaciones, la salida digital del registro de aproxima- 
ciones sucesivas indica todos aquellos bits que se mantienen encendidos y produce el código 
digital deseado. Así, este tipo de convertidor A/D fija un bit por cada ciclo de reloj, y de este 
modo sólo requiere de n ciclos de reloj para generar n bits, donde » es la resolución del conver- 
tidor en bits. (El número n de bits empleados determina la exactitud de conversión.) El tiempo 
requerido para la conversión es aproximadamente 24seg o menos para una conversión de 12 
bits. 


Errores en convertidores A/D. Los convertidores analógico-digitales reales difieren de los 
convertidores ideales en que los primeros siempre tienen algunos errores, tales como errores de 
nivel, de linealidad y de ganancia; las características de éstos se muestran en la figura 1-10. También, 
es importante observar que las características entrada-salida cambian con el tiempo y con la tempe- 
ratura. 

Por último, se debe observar que los convertidores comerciales se especifican para tres rangos 
de temperatura: comercial (0 °C a 70 °C), industrial (225 °C a 85 °C) y militar (+55 °C a 125 °C). 


Convertidores digital-analógico (D/A). A la salida del controlador digital la señal digital se 
debe convertir en una señal analógica mediante el proceso conocido como conversión digital-analógica. 
Un convertidor D/A es un dispositivo que transforma una entrada digital (números binarios) en una 
salida analógica. La salida, en la mayoría de los casos, es una señal de voltaje. 

Para el rango completo de la entrada digital, existen 2” valores analógicos correspondientes 
diferentes, incluyendo el 0. Para la conversión digital-analógica existe una correspondencia uno a uno 
entre la entrada digital y la salida analógica. 

En general se emplean dos métodos para la conversión digital-analógica: el método que utiliza 
resistores ponderados y el otro que utiliza la red en escalera R-2R. El primero es sencillo en la 
configuración del circuito, pero su exactitud puede no ser muy buena. El segundo es un poco más 
complicado en configuración, pero es más exacto. 

En la figura 1-11 se muestra el diagrama de un convertidor D/A que emplea resistores ponde- 
rados. Los resistores de entrada del amplificador operacional tienen valores ponderados en forma 
binaria. Cuando el circuito lógico recibe un 1 binario, el interruptor (en realidad una compuerta 
electrónica) conecta el resistor al voltaje de referencia. Cuando el circuito lógico recibe un 0 binario, 
el interruptor conecta el resistor a tierra. Los convertidores digital-analógicos empleados en la prác- 
tica común son del tipo paralelo: todos los bits que intervienen se aplican simultáneamente de la 
entrada digital (números binarios). 

Así el convertidor D/A genera el voltaje de salida analógico correspondiente al voltaje digital 
dado. Para el convertidor D/A que se muestra en la figura 1-11, si el número binario es b3b,b,bp, 
donde cada una de las b puede ser ya sea un 0 o un 1, entonces la salida es 
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Figura 1-10 Errores en convertidores A/D: a) error de 
0 i FS FS nivel; b} error de linealidad: c) error de ganancia. 


000 


Nótese que a medida que el número de bits se incrementa el intervalo de valores de los resistores se 
hace más grande y la exactitud se empobrece. 

.. En la figura 1-12 se muestra un diagrama esquemático de un convertidor D/A de n-bits que 
utilizà un circuito en escalera R-2R. Observe que con excepción del resistor de realimentación (el 
cual es 3R) todos los resistores involucrados son ya sea R o 2R. Esto significa que se puede alcanzar 
un alto nivel de exactitud. El voltaje de salida en este caso puede estar dado mediante 

1 L 


V= oni + bn- ER 75 bo)Va 


Reconstrucción de la señal de entrada mediante circuitos de retención. La operación de 
muestreo produce una señal de pulsos modulados en amplitud. La función de la operación de reten- 
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Figura 1-11 Diagrama esquemático de un convertidor D/A que emplea resistores ponderados. 


ción es reconstruir la señal analógica que ha sido transmitida como un tren de pulsos muestreados. 
Esto es, el propósito de la operación de retención es rellenar los espacios entre los períodos de 
muestreo y así reconstruir en forma aproximada la señal analógica de entrada original. 

El circuito de retención se diseña para extrapolar la señal de salida entre puntos sucesivos de 
acuerdo con alguna manera preestablecida. La forma de onda de escalera de la salida que se muestra 
en la figura 1-13 es la forma más sencilla para reconstruir la señal de entrada original, El circuito de 
retención que produce dicha forma de onda de escalera se conoce como retenedor de orden cero. 
Debido a su simplicidad, el retenedor de orden cero se emplea por lo regular en sistemas de control 
digital. 


-V, 


ref 





Figura 1-12 Convertidor D/A de n-bits que usa un circuito escalera R-2R. 
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Salida 





0 ¢ Figura 1-13 Salida de un retenedor de orden cero. 


Se dispone de circuitos de retención más sofisticados que el de orden cero. Estos se conocen 
como circuitos de retención de orden superior e incluyen los retenedores de primero y segundo orden. 
En general los circuitos de retención de orden superior reconstruirán una señal de manera más exacta 
que los retenedores de orden cero, pero con algunas desventajas, como se explicará posteriormente. 

El retenedor de primer orden mantiene el valor de la muestra anterior, así como el de la presente, 
y mediante extrapolación predice el valor de la muestra siguiente. Esto se logra mediante la generación 
de la pendiente de salida igual a la pendiente de un segmento de línea que conecta la muestra actual 
con la anterior y proyectando ésta desde el valor de la muestra actual, como se puede apreciar en la 
figura 1-14. 

Como se puede ver fácilmente en la figura, si la pendiente de la señal original no cambia 
mucho, la predicción es buena. Sin embargo, si la señal original invierte su pendiente, entonces la 
predicción es mala y la salida sigue la dirección equivocada, causando así un gran error para el 
período de muestreo considerado. 

Un retenedor de primer orden con interpolación, también conocido como retenedor poligonal, 
reconstruye la señal original de una manera mucho más exacta. Este circuito de retención también 
genera una línea recta a la salida cuya pendiente es igual a aquella que une el valor de la muestra 
anterior con el valor de muestra actual, pero esta vez la proyección se hace desde el punto de la 





0 e Figura 1-14 Salida de un retenedor de primer orden 
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Figura 1-15 Salida de un retenedor de primer orden con 
interpolación (retenedor poligonal). 





muestra actual con la amplitud de la muestra anterior. Por lo tanto, la exactitud al reconstruir la señal 
original es mejor que para otros circuitos de retención, pero existe un período de muestreo de retardo, 
como se muestra en la figura 1-15. En efecto, la mejoría en la exactitud se logra a expensas de un retardo 
de un período de muestreo. Desde el punto de vista de la estabilidad de los sistemas en lazo cerrado, 
dicho retardo no es deseable, y de este modo el retenedor de primer orden con interpolación (reten- 
ción poligonal) no se emplea en aplicaciones de sistemas de control. 


1-5 COMENTARIOS FINALES 


En la conclusión de este capítulo se compararán los controladores digitales y los analógicos utiliza- 
dos en sistemas de control industrial y se revisarán algunos conceptos sobre el control digital de 
procesos. Entonces se presentará la organización del libro. 


Controladores digitales y analógicos. Los controladores digitales solamente operan sobre 
números. La toma de decisiones es una de sus funciones importantes. Estos a menudo se utilizan 
para resolver los problemas relacionados con la operación global óptima de plantas industriales. 

Los controladores digitales son muy versátiles. Éstos pueden manejar ecuaciones de contro! 
no lineales que involucran cálculos complicados u operaciones lógicas. Se puede utilizar con 
controladores digitales una variedad mucho más amplia de leyes de control que las que se pueden 
usar con controladores analógicos. También en el controlador digital, mediante la edición de un 
nuevo programa, las operaciones que se están ejecutando se pueden cambiar por completo. Esta 
característica es en particular importante si el sistema de control va a recibir información o instruc- 
ciones de operación desde algún centro de cálculo donde se hacen análisis económicos y estudios de 
optimización. 

Los controladores digitales son capaces de ejecutar cálculos complejos con exactitud constan- 
te a alta velocidad y pueden tener casi cualquier grado deseado de exactitud de cálculo con un 
incremento relativamente pequeño en el costo. 

En un principio los controladores digitales se usaron sólo como componentes en sistemas de 
contro! a gran escala. Actualmente, sin embargo, gracias a la disponibilidad de microcomputadoras 
baratas, los controladores digitales se utilizan en muchos sistemas de control de gran y pequeña 
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escala. De hecho, los controladores digitales están reemplazando a los controladores analógicos que 
han sido utilizados en muchos sistemas de control a pequeña escala. Los controladores digitales son 
a menudo superiores en desempeño y con un costo menor que sus contrapartes analógicas, 

Los controladores analógicos representan las variables en una ecuación mediante cantidades 
físicas continuas. Éstos se pueden diseñar fácilmente para servir de manera satisfactoria como 
controladores que no tienen que tomar decisiones. Pero el costo de las computadoras o controladores 
analógicos se incrementa rápidamente a medida que la complejidad del cálculo se incrementa, si se 
tiene que mantener una exactitud constante. 

Existen ventajas adicionales de los controladores digitales sobre los analógicos. Los compo- 
nentes digitales, tales como circuitos de muestreo y retención, convertidores A/D y D/A y los 
transductores digitales, son de construcción robusta, alta confiabilidad y a menudo compactos y 
ligeros. Además, los componentes digitales tienen alta sensibilidad y con frecuencia son más baratos 
que sus contrapartes analógicas y son menos sensibles a señales de ruido. Y, como se mencionó en 
un principio, los controladores digitales son flexibles al permitir cambios en la programación. 


Control digital de procesos. En general, en sistemas de control de procesos industriales, no 
es práctico operar por períodos de tiempo muy prolongados en estado estacionario, debido a que se 
pueden presentar ciertos cambios en los requerimientos de producción, materias primas, factores 
económicos y equipos y técnicas de procesamiento. Así, el comportamiento transitorio de los proce- 
sos industriales debe siempre tomarse en consideración. Debido a que existen interacciones entre las 
variables de proceso, al utilizar una sola variable de proceso para cada uno de los agentes de control 
no es apropiado para un control completo real. Mediante el uso de un controlador digital, es posible 
tomar en cuenta todas las variables del proceso, conjuntamente con los factores económicos, los 
requerimientos de producción, el desempeño del equipo y todas las demás necesidades, y de este 
modo alcanzar el control óptimo de los procesos industriales. 

Observe que un sistema capaz de controlar un proceso tan completamente como pueda, deberá 
resolver ecuaciones complicadas. En el control más completo, lo más importante es que se conozcan 
y empleen las relaciones correctas entre las variables de operación. El sistema debe ser capaz de 
aceptar instrucciones desde muy variadas fuentes como computadoras y operadores humanos y 
debe también ser capaz de cambiar por completo su subsistema de control en un tiempo corto. Los 
controladores digitales son los más apropiados en dichas situaciones. De hecho, una de sus ventajas 
es su flexibilidad, esto es, la facilidad de cambiar los esquemas de control mediante reprogramación. 

En el control digital de un proceso complicado, el diseñador debe tener un buen conocimiento 
del proceso a ser controlado y debe ser capaz de obtener su modelo matemático. (El modelo matemá- 
tico se puede obtener en términos de ecuaciones diferenciales o en diferencias, o de alguna otra 
forma.) El diseñador debe estar familiarizado con la tecnología de medición asociada con la salida y 
otras variables relacionadas en el proceso. Él o ella debe tener un buen conocimiento del trabajo con 
computadoras digitales, así como de la teoría de control moderno. Si el proceso es complicado, el 
diseñador debe investigar varios enfoques diferentes para el diseño del sistema de control. A este 
respecto, sería útil un buen conocimiento de técnicas de simulación. 


Organización del libro. El objetivo de este libro es presentar una visión detallada de la 
teoría de control que es relevante al análisis y diseño de sistemas de control en tiempo discreto. Se 
enfatizan los conceptos básicos involucrados. En este libro, con frecuencia los controladores digitales 
se diseñan en la forma de funciones de transferencia pulso o ecuaciones en diferencias equivalentes. 
las cuales se pueden implantar fácilmente en la forma de programas de computadora. 
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La organización del libro es como sigue. El capitulo 1 ha presentado material introductorio. El 
capítulo 2 presenta la teoría de la transformada z. Este capítulo incluye la transformada z de funciones 
elementales, propiedades y teoremas importantes de la transformada z, la transformada z inversa y la 
solución de ecuaciones en diferencias mediante el método de la transformada z. El capítulo 3 presenta 
material de antecedentes para el análisis de sistemas de control en el plano z. Este capítulo incluye 
discusiones del muestreo mediante impulsos y la reconstrucción de señales originales a partir de 
señales muestreadas, funciones de transferencia pulso y la realización de controladores y filtros 
digitales. 

El capítulo 4 presenta en principio la relación entre los planos s y z y entonces se discute el 
análisis de estabilidad de los sistemas en lazo cerrado en el plano z, seguido del análisis de las 
respuestas transitoria y en estado estacionario, diseñado mediante los métodos del lugar geométrico 
de las raíces y de la respuesta en frecuencia y el método analítico de diseño. El capítulo $ presenta la 
representación en el espacio de estados de sistemas en tiempo discreto, la solución de las ecuaciones 
de estado en tiempo discreto y la matriz de funciones de transferencia pulso. Después, se trata la 
discretización de las ecuaciones en el espacio de estados en tiempo continuo y el análisis de estabi- 
lidad de Liapunov. 

El capítulo 6 presenta el diseño de sistemas de control en el espacio de estados. El capítulo inicia 
con una presentación detallada de controlabilidad y observabilidad. Entonces se presentan las téc- 
nicas de diseño basadas en la ubicación de polos, seguido por una discusión de observadores de es- 
tado de orden completo y de orden mínimo. Este capítulo se concluye con el diseño de sistemas de 
seguimiento. El capítulo 7 trata el enfoque de ecuaciones polinomiales al diseño de sistemas de con- 
trol. El capítulo comienza con el estudio de las ecuaciones Diofantinas. Entonces se presenta el diseño 
de sistemas de regulación y sistemas de control empleando la solución de las ecuaciones Diofantinas. 
Este enfoque es una alternativa al de ubicación de polos combinado con los observadores de orden 
mínimo. En este capítulo se incluye el diseño de sistemas de control mediante el acoplamiento a un 
modelo. Por último, el capítulo 8 trata en detalle los problemas de control óptimo cuadrático. 

El análisis en el espacio de estados y el diseño de sistemas de control en tiempo discreto, que se 
presenta en los capítulos 5, 6 y 8, hace un uso extensivo de vectores y matrices. En el estudio de estos 
capítulos el lector puede, si la necesidad surge, referirse al apéndice A, el cual resume el material 
básico del análisis de vectores y matrices. El apéndice B presenta material referente a la teoría de la 
transformada z que no se incluyó en el capítulo 2. El apéndice C trata los problemas de diseño 
mediante la ubicación de polos cuando el control es una cantidad vectorial. 

En cada uno de los capítulos, excepto el capítulo 1, el texto principal está seguido por proble- 
mas resueltos y por problemas propuestos. El lector deberá estudiar y resolver los problemas cuida- 
dosamente. Los problemas resueltos son una parte integral del texto. Los apéndices A, B y C están 
seguidos por problemas resueltos. El lector que estudie estos problemas tendrá un mejor entendi- 
miento del material presentado. 
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La transformada z 


2-1 INTRODUCCIÓN 


Una herramienta matemática muy utilizada en el análisis y la síntesis de sistemas de control en 
tiempo discreto es la transformada z. El papel de la transformada z en sistemas en tiempo discreto es 
similar al de la transformada de Laplace en sistemas en tiempo continuo, 

En un sistema de control en tiempo discreto, una ecuación en diferencias lineal caracteriza la 
dinámica del sistema. Para determinar la respuesta del sistema a una entrada dada, se debe resolver 
dicha ecuación en diferencias. Con el método de la transformada z, las soluciones a las ecuaciones en 
diferencias se convierten en un problema de naturaleza algebraica. (De la misma forma en que la 
transformada de Laplace transforma las ecuaciones diferenciales lineales invariantes en el tiempo en 
ecuaciones algebraicas en s, la transformada z transforma las ecuaciones en diferencias lineales e 
invariantes en el tiempo en ecuaciones algebraicas en z.) 

El principal objetivo de este capítulo es presentar las definiciones de la transformada z, los 
teoremas básicos asociados con ella y los métodos para encontrar la transformada z inversa. También 
se estudia la solución de ecuaciones en diferencias mediante el método de la transformada z. 


Señales en tiempo discreto. Las señales en tiempo discreto surgen si el sistema involucra la 
operación de muestreo de señales en tiempo continuo. La señal muestreada es (0), (7), xQT),..., 
donde Tes el período de muestreo. Dicha secuencia de valores que surge de la operación de muestreo 
normalmente se escribe como x(kT ). Si el sistema incluye un proceso iterativo realizado por una 
computadora digital, la señal involucrada es una secuencia de números x(0), x(1), x(2). .... La se- 
cuencia de números normalmente se escribe como x(k), donde el argumento k indica el orden en el 
que se presentan los números en la secuencia, por ejemplo, x(0), x(1), x(2). . .. Aunque x(k) es una 
secuencia de números, ésta se puede considerar como una señal muestreada de x(f) cuando el perío- 
do de muestreo T es 1 segundo. 


23 
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La transformada z se aplica a la señal en tiempo continuo x(£), a la señal muestreada x(AT) y a la 
secuencia de números x(k). Si no se presenta confusión en el estudio al tratar con la transformada z, 
de manera ocasional se emplean x(A7) y x(k) intercambiadas. [Esto es, para simplificar la presentación, 
en Ocasiones se omite la aparición explícita de T y se escribe x(k7) como x(k).] 


Organización del capítulo. En la sección 2-1 se presentaron comentarios introductorios. En 
la sección 2-2 se expone la definición de la transformada z y los temas asociados con ésta. En la 
sección 2-3 se dan las transformadas z de funciones elementales. Las propiedades y teoremas impor- 
tantes de la transformada z se presentan en la sección 2-4. En la sección 2-5 se estudian los métodos 
analíticos y computacionales para encontrar la transformada z inversa. En la sección 2-6 se presenta la 
solución de ecuaciones en diferencias mediante el método de la transformada z. Por último, en la 
sección 2-7 se dan los comentarios finales. 


2-2 LATRANSFORMADA z 


El método de la transformada z es un método operacional muy poderoso cuando se trabaja con 
sistemas en tiempo discreto. A continuación se definirá la transformada z de una función del tiempo o 
de una secuencia de números. 

Al considerar la transformada z de una función del tiempo x(£), sólo se toman en cuenta los 
valores muestreados de x(£), esto es, (0), x(D, x(2T), ... , donde T es el período de muestreo. 

La transformada z de una función del tiempo x(£), donde f es positivo, o de la secuencia de 
valores x(4T), donde k adopta valores de cero o de enteros positivos y Tes el periodo de muestreo, se 
define mediante la siguiente ecuación: 


X(2) = Z [x] = Z[x(kT)] = È x(kT)2* (2-1) 
k=0 
Para una secuencia de números x(k), la transformada z se define como 
X(2) = Z [x(k)] = 2 x(k)z* (2-2) 
k=0 
La transformada z definida mediante las ecuaciones (2-1) o (2-2) se conoce como transformada z 
unilateral. 

El símbolo .Z denota la “transformada z de”. En la transformada z unilateral se supone que 
x(£ = 0 para 1 < 0 o x(k) = 0 para k < 0. Observe que z es una variable compleja. 

Observe que, cuando se trata con una secuencia de tiempo x(k7) que se obtuvo mediante el 
muestreo de una señal x(1), la transformada z X(z) involucra de manera explícita a T. Sin embargo, 
para una secuencia de tiempo x(k), la transformada z X(z) no lo incluye a T explícitamente. 

La transformada z de x(£), donde -x < 4 < %, o de x(k), donde k adopta valores enteros (k = 0, 
+1, +2, -+ +), se define mediante 


s 


2 


X(2) = 2 [x(0)] = ZKT] = Y x(kT)20* (23) 


=--% 


vr Freatikog.me > x(k)z* (2-4) 
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La transformada z definida mediante las ecuaciones (2-3) o (2-4) se denomina transformada z bilate- 
ral. En la transformada z bilateral, se supone que la función x(t) es distinta de cero para £ < 0 y se 
considera que la secuencia x(k) tiene valores distintos de cero para k < 0. Ambas transformadas z, la 
unilateral y la bilateral, son series de potencias de z~". (La transformada bilateral incluye tanto poten- 
cias positivas como negativas de z ~'.) En este libro, sólo se considera de manera detallada la transfor- 
mada z unilateral. 

Para la mayoría de las aplicaciones en ingeniería, la transformada z unilateral tendrá una solu- 
ción apropiada en forma cerrada en su región de convergencia. Observe que cuando X(z), una serie 
infinita en z ~', converge fuera del círculo |z| = R, donde R se conoce como radio de convergencia 
absoluta. Al utilizar el método de la transformada z para resolver problemas en tiempo discreto no es 
necesario especificar los valores de z para los cuales X(z) converge. 

Observe que la expansión del segundo miembro de la ecuación (2-1) da como resultado 


X(2) = x(0) + x(T)z +x(QT)2 +++ +x(kT)23*+:-+-- (2-5) 


La ecuación (2-5) implica que la transformada z de cualquier función en tiempo continuo x(£) se 
puede escribir, mediante inspección, en la forma de una serie. La z * en esta serie indica la posición en 
el tiempo en la que se presenta la amplitud x(AT). De manera contraria, si X(z) está dada en la forma de 
una serie como la que se indicó, la transformada z inversa se puede obtener por inspección como una 
secuencia de la función x(kT) que corresponde a los valores de x(£) en los valores de tiempo respec- 
tivos. 

Si la transformada z está dada como el cociente de dos polinomios en z, entonces la transfor- 
mada z inversa se puede obtener mediante varios métodos diferentes, tales como el método de la 
división directa, el método computacional, el método de expansión en fracciones parciales y el mé- 
todo de la integral de inversión (para mayores detalles véase la sección 2-5). 
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A continuación se presentará la transformada z de varias funciones elementales. Observe que en la 
teoría de la transformada z unilateral, al muestrear una señal discontinua x(£), se supone que la 
función es continua por la derecha; esto es, si la discontinuidad se presenta en f = 0, entonces se 
supone que x(0) es igual a x(0+) en lugar del promedio en la discontinuidad, [x(0—) + x(0+)]/2. 


Función escalón unitario. Encuentre la transformada z de la función escalón unitario 


e > 0st 


t<0 


Como se puede observar, en el muestreo de la función escalón unitario se supone que esta función es 
continua por la derecha; esto es, 1(0) = 1. Entonces, refiriéndose a la ecuación (2-1), se tiene 


pas 


X(2) = Z[1(0)] = Tiie 


k 


=1+2 14204204 + 


Y 
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z= 1 
Observe que la serie converge si |z| > 1. Al encontrar la transformada z, la variable z actúa como un 
operador mudo. No es necesario especificar la región de z en la que X(z) converge. Es suficiente 
saber que dicha región existe. La transformada z X(z) de una función del tiempo x(1) que se obtiene 
de esta manera es válida en todo el plano z excepto en los polos de X(z). 
Se debe observar que 1(k) definida mediante 


fl. k=0,1,2,... 
100 = (y k<0 


comúnmente se conoce como secuencia escalón unitario. 


Función rampa unitaria. Considere la función rampa unitaria 


_J£, 0st 
=g t<0 


Observe que 
x(kT) = KT, k = 0,1,2,... 


La figura 2-1 representa la señal rampa unitaria muestreada. Las magnitudes de los valores muestreados 
son proporcionales al período de muestreo 7. La transformada z de la función rampa unitaria se puede 
escribir como 


X(2) =Z [1] = È x(kT)z™* = X kTz* = TĎ k2* 
k=0 k=0 k=0 
= T(z + 2277? + 3z? +...) 


z`! 


MU 
Tz 
2-1) 


. xt) 





0 T 27 3T 4T t Figura2-1 Señal rampa unitaria muestreada. 
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Observe que es una función del período de muestreo T. 


Función polinomial a*. Obtenga la transformada z de x(k) definida como 


Es k=0,1,2,... 
s = fo k<0 


donde a es una constante. Con referencia a la definición de la transformada z dada por la ecuación 
(2-2), se obtiene 


Ed 


X(z) = Z [a] = Y x(k)z* = Jaro 





k=0 
PO EOI 
sondu 
1 — az” 
a z 
z—a 


Función exponencial. Encuentre la transformada z de 


OAT, 
Puesto que 
x(kT) = e™T, k = 0,1,2,... 
se tiene que 


X(2) = Z[e"] = Š xkrz* = $ eatz 


k=0 
=] ez y eT? 4 eT H 


T 1 

1 aS e™“Tz! 
_ z 
a z— er 


Función senoidal. Considere la función senoidal 


¿da CE 


Si observamos que 


e'* = cos wt + j sen ot 


ela 


ii 


cos wt — j sen wt 


se tiene 


1 ; ; 
= — jot jwt 
sen wt J (e ewy 
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Como la transformada z de la función exponencial es 
Sé 1 
Z [e '] = 1 = gaf -1 


e z 


se tiene 


X(z) = Z [sen wt] = z| (e! — e=) 


-1 (5 2 an] 
211- ez 1-etTg 
E 1 (eje? “A ema 
2j1 2 (eje? + Paid? + z 7? 
z7* sen wT 
1-22 coswT + z~? 


z sen wT 
z? — 2z coswT + 1 


Ejemplo 2-1 
Obtenga la transformada z de la función coseno 


_ jcoswt, 0st 
-fe t<0 


Si se procede de manera similar a la forma en la que se trató a la transformada z de la función seno, 


se tiene 


X(2) = Z [cos æt] = 12 je” + e] 


1 1 1 
ARA 


e E n (eT + e)z 
2 1 es (e? + ergo + z 7? 
1-z7* coswT 
1-27 coswT + z7? 








z? — z coswT 
z? — 2z coswT + 1 





Ejemplo 2-2 
E Obtenga la transformada z de 


Cuando se da una función en s, una manera de encontrar la transformada z correspondiente es convertir 
X(s) en x(£) y entonces encontrar la transformada z de x(£). Otro enfoque es expandir X(s) en fracciones 
parciales y utilizar la tabla de transformadas z para encontrar la transformada z de los términos expandi- 
dos. No obstante, se estudiarán otros enfoques en la sección 3-3. 


www.FreeLibros.me 


Sección 2-3 Transformada z de funciones elementales 29 


La transformada inversa de Laplace de X(s) es 
xX(t)=1-e", 0st 


Por consiguiente, 
EEE: C 1 
X(2) =2 (1 -e =p le Tz! 
E (1 -e nz" 
Aa-z254M-e 75) 
O IAS 
-DG-e”) 


Comentarios. De la misma forma como se trabaja con la transformada de Laplace, una tabla 
de las transformadas z de las funciones comúnmente encontradas es muy útil en la resolución de 
problemas en el campo de los sistemas en tiempo discreto. La tabla 2-1 es de este tipo. 


TABLA 2-1 TABLA DE TRANSFORMADAS z 
X(s) x(t) x(kT)o x(k) 
Delta de Kronecker 8,(4) 


1, k=0 
0, k#0 




















T?z2 '(1 + 2`) 
(-2"y 








To (1 +42 +27 
MTS 


a Lea e aT lea ra ema" 
s(s + a) U=2 NeT 
b=a ep ¿AT — eT a E MS 
{s + as + b) a- (üi -etz 50 ez H- eT z5 
1 TT Teo rz* 
PICA (1 -ge *Tz Y 
1 (14 aD)e 77" 
S dE al e -akT A AE 
j ii a e 3 





«TY 
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TABLA 2-1 (continuación) 


Te 271 +eTz bz 
2,-a 2 ,-akT 
Hi i a — Erea 
EEE reaa [(aT -1 +e) + (1 -e -aTe “zz 
` ss +a) 


(1 a za pai ez) 


-1 
z senwT 
sen wt sen wk T (q S 
1- z` coswT 
COS wt eos wk T Há 


ez 1senwT 


1-20 z~ coswT + e 177? 








































“ sen wt T sen wkT 


OESTE 


s+a 
S Se ay bi E Pas 


1-e 27 coswT 


1-20" z coswT + e z? 








158] 
© 


o pd — 
£ so o0 a 


-1 -1 
P 2 (1 + az`') 
aJ | Je | (ay 


27 (1 + 4az' +a?27?) 
(l-az y 


A 2 (1 + laz? + 1172? + a?27?) 
i (1 -az y 

24 a* coskrr =i 
i 1+az" 

25 k(k — 1) 27? 
; 2! G=% 

















k(k — »- «(km +2) qe 
(n= 1)! (235 
Ue = Da 
(1- > 
k(k — 1)---(k —- m + 2) pom qm 
(m - 1)! (1 —az”y” 





x(t) = 0, para t < 0. 

x(kT) = x(k) = 0, for k < 0. 

A menos que se indique otra cosa, k=0, 1,2,3,.... 
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2-4 PROPIEDADES Y TEOREMAS IMPORTANTES 
DELA TRANSFORMADA z 


El uso del método de la transformada z en el análisis de sistemas de control en tiempo discreto se 
puede facilitar si se hace referencia a los teoremas de la transformada z. En esta sección se presentan 
las propiedades importantes y los teoremas útiles de la transformada z. Se supone que la función del 
tiempo x(£) tiene transformada z y que x(t) es cero para £ < 0, 


Multiplicación por una constante. Si X(=) es la transformada z de x(1), entonces 
Z [ax(t)] = a Z[x(t)] = aX(z) 


donde a es una constante. 
Para probar esto, observe que, por definición 


Z [ax(t)] = Y ax(kT)z” =a > x(kT)2"* = aX(z) 


Linealidad de la transformada z. La transformada z posee una propiedad importante: la 
linealidad. Esto significa que, si f (K) y g(k) tienen transformada z y e y B son escalares, entonces x(k) 
formada por una combinación lineal 


x(k) = af(k) + Pg(k) 
tiene la transformada z 
X(z) = aF(z) + BG(2) 


donde F(z) y G(2) son las transformadas z de f(k) y g(k), respectivamente. 
La propiedad de linealidad se puede probar refiriéndose a la ecuación (2-2) como sigue: 


X(2) = Z [(k)] = Z [af(k) + Bg(k)] 


xo 


Y) [af(k) + Bg(k)]z 


, È fo~ + BÈ gz“ 


az [f()] + BZ lg) 


= aF(z) + BG(z) 
Multiplicación por af. Si X(=) es la transformada z de x(k), entonces la transformada - de «/ 
x(k) está dada por X(a' z): 


il 


ii 


ii 


Zlatx(k)] = X(a™' z) (2-6) 


Esto se puede probar como sigue: 


x 


Z lat x(x)] = $ at x(k)z™* = Y x(k)(a zz) * 


k=0 k=0 
= X(a z) 
Teorema de corrimiento. El teorema de corrimiente que se presenta aquí se conoce también 
como teorema de translación real. Si x(1) =0 para 1<0 y x(/) tiene la transformada z M(z), entonces 
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Zlx(t-nTD)]=2"X(2) (2-7) 


Z[x(t+ nT)] = rxe) - Sano" | (2-8) 


donde z es cero o un entero positivo. 
Para probar la ecuación (2-7), observe que 


w% 


Z[x(t- nT)] = È KT = nT)z™ 
=z" > x(kT — nT)z (2-9) 


Al definir m = k — n, la ecuación (2-9) se puede escribir como sigue: 

Zlx(t=nT)]=2" Y x(mD)z" 
Puesto que x(mT) = 0 para m < 0, se podría cambiar el límite inferior de la sumatoria de m =-— n por 
m=0. Por tanto, 


ES 


Z [x= aTD)=2" YN x(mT)2"" =2"X(2) (2-10) 


De este modo, la multiplicación de una transformada z por z” tiene el efecto de retrasar la función del 
tiempo x(£) un tiempo nT. (Esto es, mover la función a la derecha un tiempo nT.) 
Para probar la ecuación (2-8), se observa que 


e 


È x(kT +nT)z* 


k=0 


Z [x(t + nT)] 


=z" D x(kT + nT)]2 0%” 


x(kT + nT)2 00 + E x(kT)z™* — Erir] 


T 
AÈ 


TOI EM 


x(kT)z™* — 3 dee 


|x) - S xT] 
k=0 
Para la secuencia de números x(k), la ecuación (2-8) se puede escribir como sigue: 
n-1 
Z [x(k + n)] = exo -> xr 
k=0 
A partir de esta última ecuación, se obtiene 
Z [x(k + 1)] = zX(z) — zx(0) (2-11) 
Z[x(k + 2)] = zZ [x(k + 1)] — zx(1) = z?X(z) — z22x(0) ~ zx(1) (2-12) 
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De manera similar, 
Zlx(k + n)] 
= 2"X(2) - 2"x(0) — 27 x(1) — z"? x(2) - +- — zx(n — 1) (2-13) 
donde n es un entero positivo. 
Recuerde que la multiplicación de X(z) por z tiene el efecto de avanzar la señal x(kT) un paso (un 


periodo de muestreo) y que la multiplicación de la transformada z X(z) por z ` tiene el efecto de retrasar 
la señal x(XT) un paso (un período de muestreo). 


Ejemplo 2-3 
Encuentre las transformadas z de una función escalón unitario que está retrasada un período de muestreo 
y cuatro períodos de muestreo, respectivamente, como se muestra en las figuras 2-2a) y b). 
Mediante el teorema de corrimiento dado por la ecuación (2-7), se tiene 


ZUE- Dis 22] a “IP 


También, 


Z [+ - 4D] = 2 *2Z [10] = zro Si 


(Observe que z ~ representa el retardo de un período de muestreo T, sin tomar en cuenta el valor de 7.) 
Ejemplo 2-4 
Obtenga la transformada z de 


a k=1,2,3,... 
ra =le k=0 


x(t) 
t-r) 
1 
0 T 27 37 4T 5T 67 7T 8T t 
a) 
x1t) 
Iit- 47) 
1 
0 T 27 3T AT 57 6r 7r 8T t Figura 2-2 a) Función escalón unitario 
retardada | período de muestreo: b) 
función escalón unitario retardada 4 
b) periodos de muestreo. 
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Si tomamos la ecuación (2-7) como referencia, se tiene 
Z [xk — 1)] =z X() 


La transformada z de a" es 


1 
k] = —_— 
Z [a*] TER 
y de este modo 
ZI za = 2 n 
1-az' 1-az" 
donde k=1,2,3,... 
Ejemplo 2-5 
Considere la función y(k), la cual es la suma de funciones x(A), donde h = 0, 1, 2, .. . , k, tal que 
k 
y(k) = Y x(h), RON 


h=0 


donde y(k) = 0 para k < 0. Obtenga la transformada z de y(k). 
Primero observe que 


y(k) = x(0) + x(1) + +: + x(k — 1) + x(k) 
y(k — 1) = x(0) + x(1) + --- + x(k — 1) 


De aquí, 
y(k) — y(k — 1) = x(k), k=0,1,2,... 
Por lo tanto, 
Z [y(k) = y(k - D] = Z [x(k)] 
o 
Y(z) - 7 Y(z) = X(z) 
lo cual da 


1 
Y(z) = 0) 
donde X(2) = Z [x (4)]. 


Teorema de traslación compleja. Si x(t) tiene la transformada z X(z), entonces la transforma- 
da z de e" x(t) está dada por X(ze””). Esto se conoce como teorema de traslación compleja. 
Para probar este teorema, observe que 


Z [ex] = Exe Tz = Y x(kT ze”) += X (ze) (2-14) 


k=0 k=0 
De esta manera, se ve que al reemplazar z en X(z) por ze“ da la transformada z de e“ x(t). 
Ejemplo 2-6 


Dadas las transformadas z de wt y cos wt, obtenga la transformada z de e 
vamente, mediante el uso del teorema de traslación compleja. 


at 


sen wt y e" cos wt, respecti- 
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Si observamos que 


z~! senwT 


Z | sent] = 75 
|senat] 1-22 coswT + 27? 


al 


sustituimos =z por ze”? para obtener la transformada z de e™ sen wt. como sigue: 


ez? senwT 


-2aT „ -2 


Z [e7 sen wot] = q r 
[ ] 1- 2e z! coswT + e° z 


De manera similar. para la función coseno, se tiene 


1-27 coswT 


Z [cos wt] = =—=—————= 
| ] 1-22) coswT + 27? 


Mediante la sustitución de z por ze” en la transformada z de cos wt, se obtiene 


1 = e° z~ coswT 


-2aT ,--2 


Zle” cos wt] = —_————_———_——= 
[ ) 1-2e z"! coswuT+e??z 


Ejemplo 2-7 
Obtenga la transformada z de te“. 
Tenga en cuenta que 


A CA 
Ms p 
De este modo. 
Te Tz! 


Z [te] = X(ze””) = a- "Y 


Teorema del valor inicial. Si x(t) tiene la transformada z X(2) y si el lim X(z) existe, entonces 
el valor inicial x(0) de x(£) o x(k) está dado por TA 


x(0) = lim X(z) (2-15) 


Para probar este teorema, observe que 
X(2) = E x(k)z™ = x(0) + x(1)27 + x(Q)2*+- -- 
k=0 

Al hacer que z > * en esta última ecuación, se obtiene la ecuación (2-15). De esta forma, el compor- 
tamiento de la señal en la vecindad de £=0 o k = 0 se puede determinar mediante el comportamiento de 
X(z) cuando z = x. 

El teorema del valor inicial es conveniente para verificar la incidencia de posibles errores en el 
cálculo de la transformada z. Debido a que x(0) normalmente se conoce, una verificación del valor 
inicial mediante lim X(z) puede facilitar descubrir errores en X(z), si éstos existen. 


Ejemplo 2-8 
Determine el valor inicial x(0) si la transformada - de x(7) está dada por 
(1 — e7)! 
(1-2 D0M-e*z20) 
Mediante el uso del tcorema del valor inicial, se encuentra 
3 Q- eT! 
x(0) = lim xx = 
(0) =(1-2M(1-e 27) 
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En referencia al ejemplo 2-2, observe que esta X(z) fue la transformada z de 
xt) =i- e” 


y así x(0)= 0, lo cual concuerda con el resultado que se obtuvo al principio. 


Teorema del valor final. Suponga que x(k), donde x(k) = 0 para k < 0, tiene la transformada 
z X(z) y que todos los polos de X(z) están dentro del círculo unitario, con la posible excepción de un 
solo polo en == 1. [Ésta es la condición para la estabilidad de X(z), o la condición para que x(k) (k=0, 
1, 2, . . .) permanezca finita.] Entonces el valor final de x(k), esto es, el valor de x(k) a medida que k 
tiende a infinito, puede darse mediante 


limx(k) = lim [(1 — 2 5X(2)] (2-16) 
kx 2>1 
Para probar el teorema del valor final, observe que 


æ 


Z[x(k)] = X(2) = 2 x(k)z ~“ 


æ 


Z[x(k - 19] = z X(z) = Y x(k — 1)2* 


k=0 


Por tanto, 


æ æ 


Y x(k)z*-— © x(k — 1)z™* = X(2) - 2 X(2) 


k=0 k=0 


Si tomamos el límite cuando z tiende a la unidad, se tiene 


221 Lk=0 k=0 


im| 5 x(k)z™* — Saik - De = lim [(1 - z~')X(z)] 


Debido a la condición de estabilidad que se supuso y a la condición de que x(k) = 0 para k < 0, el primer 
miembro de esta última ecuación se convierte en 


> [x(k) = x(k — 1)] = [x(0) - x(~1)] + [x(1) — x(0)] 
+ [x(2) = (1)] + ++: = x(0) = limx(k) 
Por tanto, 
limx(k) = lim[(1 — z7)X(2)] 


que es la ecuación (2-16). El teorema del valor final es muy útil para determinar el comportamiento de 
x(k) a medida que k — x a partir de su transformada z X(z). 


Ejemplo 2-9 
Determine el valor final x(%) de 


1 1 
MD =i TT a>0 


mediante el uso del teorema del valor final. 
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Al aplicar el teorema del valor final a la X(z) dada, se obtiene 


x(®) = lim [(1 - 2 9X(2)] 


1 1 
jamri i — =1 u——— — [LaLa 
es la $ ie A E Lo)! 


Í 1- z` 
5 im ~i- 2) i 


Se observa que la X(z) dada es en realidad la transformada z de 
x(t)=1- e“ 
Al sustituir £ = æ% en esta ecuación, se tiene 
x(%) = lim (1 -e™)=1 


Como era de esperarse, los dos resultados concuerdan. 


Resumen. En esta sección se han presentado las propiedades y teoremas importantes de la 
transformada z que probarán ser de utilidad al resolver muchos problemas de la transformada z. Con 
el propósito de tener una referencia adecuada, estas propiedades y teoremas importantes se resumen 
en la tabla 2-2. (Muchos de los teoremas que se presentan en esta tabla se estudiaron en esta sección. 
Aquellos que no fueron estudiados aquí pero que se incluyen en la tabla se obtienen o prueban en el 
apéndice B.) 


2-5 LATRANSFORMADA z INVERSA 


La transformada z en sistemas de control en tiempo discreto juega el mismo papel que la transforma- 
da de Laplace en sistemas de control en tiempo continuo. Para que la transformada z sea útil, debemos 
estar familiarizados con los métodos para encontrar la transformada z inversa. 

La notación para la transformada z inversa es Z~. La transformada z inversa de X(z) da como 
resultado la correspondiente secuencia de tiempo x(k). 

Se debe observar que a partir de la transformada z inversa sólo se obtiene la secuencia de 
tiempo en los instantes de muestreo. De esta manera, la transformada z inversa de X(z) da como 
resultado una única x(k), pero no da una única x(£). Esto significa que la transformada z inversa da 
como resultado una secuencia de tiempo que especifica los valores de x(1) solamente en los valores 
discretos de tiempo, £ = 0, T, 2T, ..., y no dice nada acerca de los valores de x(t) en todos los otros 
tiempos. Esto es, muchas funciones del tiempo x(/) diferentes pueden tener la misma x(A7). Véase la 
figura 2-3. 

Cuando X(z), la transformada z de x(kT) o x(k), está dada, la operación que determina la x(47) 
o x(k) correspondiente se denomina transformación z inversa. Un método obvio para encontrar la 
transformada z inversa es referirse a una tabla de transformadas z. Sin embargo, a menos que uno se 
refiera a una tabla de transformadas z muy extensa, no sería uno capaz de encontrar la transformada 
z inversa de una función de z complicada. (Si se utiliza una tabla de transformadas z no muy extensa, 
es necesario expresar una transformada z complicada como una suma de transformadas z más senci- 
llas. Refiérase al método de expansión en fracciones parciales que se presenta en esta sección.) 

Existen otros cuatro métodos para obtener la transformada z inversa que no implican el uso de 
tablas: 
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TABLA 2-2 TEOREMAS Y PROPIEDADES IMPORTANTES DE LA TRANSFORMADA z. 


MINE ZKO] o ZEW] 
ax(t) aX(z) 
KO 
ZO 











Ka x(t + kT) z“ X(z) — z*x(0) = 2 x(T) - <-> — zx(kT - T) 
EN x(n + k) zE X(z) -2x(0) = 2 x(1) = ++ 2x(k- 1) 
9. x(n — k) ZX(z) 
x(t) Ta X) 
12. ext) X(ze**) 
a* x(k) x(2) 
ka“ x(k) -z4 x(2) 
x(0) lim X(z) si el límite existe 
lim [(1 — 271) X(2)] if (1 — 27) X(2) es analítica sobre 
Z y fuera del circulo unitario 
18. | Vx(k) = x(k) - x(k - 1) (1-2 X() 
19. | Ax(k) = x(k + 1) — x(k) (z — 1)X(z) — zx(0) 


ð ð 
T 
x 





a 


y (kT)y(nT — kT) X(2)Y(2) 
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20. 
21. 
22. 
23. 
24. 


En 
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A e 
0 T 27 3T 4T t 


Figura 2-3 Dos funciones en tiempo continuo diferentes x,(f) y xx(f), que tienen los 
mismos valores en £=0, 7, 27, ..... 


Método de la división directa 

Método computacional 

Método de expansión en fracciones parciales 
Método de la integral de inversión 


EA 


Para obtener la transformada z inversa, se supone, por lo regular, que la secuencia de tiempo 
x(kT) o x(k) es cero para k < 0. 

Antes de presentar los cuatro métodos, son convenientes algunos comentarios acerca de los 
polos y ceros de la función de transferencia pulso. 


Polos y ceros en el planoz. En aplicaciones de ingeniería del método de la transformada z, X(z) 
puede tener la forma 


boz™ + biz" + + Da 


AS z" +az™! +.. +a, 


(m = n) (2-17) 


bo(z — zı)\(z — 22): <- (Z — Zm) 


ADE PE = E Pa 


donde los p,(¿=1, 2, . . . , n) son los polos de X(z) y los z,(¡= 1, 2, . . . , m) son los ceros de X(2). 

La ubicación de los polos y los ceros de X(z) determina las características de x(k), la secuencia 
de valores o números. Como en el caso del análisis de sistemas de control lineales en tiempo continuo 
en el plano s, también se utiliza una representación gráfica de las localizaciones de los polos y ceros de 
A(z) en el plano z. 

Observe que en ingeniería de control y en procesamiento de señales, X(z) a menudo se expresa 
como un cociente de polinomios en z', como sigue: 


X(2) eE boz em + bi zuom+D +... + bz" (2-18) 
1+az + azz? + taz" 
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donde z”' se interpreta como el operador retraso unitario. En este capítulo, donde se presentaron las 
propiedades y teoremas básicos del método de la transformada z, X(z) se puede expresar en términos 
de las potencias de z, como se hace en la ecuación (2-17), o en términos de las potencias de z*', como 
en la ecuación (2-18), dependiendo de las circunstancias. 

Al encontrar los polos y ceros de X(z), es conveniente expresar X(z) como un cociente de 
polinomios en z. Por ejemplo, 


z? + 0.5z _ _z(z 05) 
z +3z+2 (z+1X(z+2) 


Es claro que X(z) tiene polos en z = -1 y z = -2 y ceros en z = 0 y z = — 0.5. Si X(z) se escribe como un 
cociente de polinomios en z”, la X(z) precedente se puede escribir como 


X(2) = 


X(2) = oa Lol NA 1+0.57* 
z) =I43z +227% (1+2D0+22)) 


Aunque los polos en z=-—1 y z = 2 y un cero en z = — 0.5 se ven claramente a partir de la expresión, el 
cero en z = 0 no se muestra de manera explicita, y de esta forma el principiante puede fallar al ver la 
existencia del cero en z = 0. Por lo tanto, al tratar con los polos y ceros de X(z), es preferible expresar 
X(z) como un cociente de polinomios en z, en lugar de polinomios en z”'. Además, en la obtención de 
la transformada z inversa que emplea el método de la integral de inversión, es deseable expresar X(z) 
como un cociente de polinomios en z, en lugar de z”', para evitar cualquier posible error al determinar 
el número de polos en el origen de la función X(z)z *7?. 


Método de la división directa. En el método de la división directa, la transformada z inversa 
se obtiene mediante la expansión de X(z) en una serie infinita de potencias de 7*. Este método es útil 
cuando es difícil obtener una expresión en forma cerrada para la transformada z inversa o se desea 
encontrar sólo algunos de los primeros términos de x(k). 

El método de la división directa proviene del hecho de que si X(z) está expandida en una serie 
de potencias de z', esto es, si 


x 


X(2) = © x(kT)z™ 
= 50) + x(T)z "+ x(2T)2 ++ +x(kT)23 ++ 
o 
X(z) = È aee 


l! 


x(0) + x(1)z7! + x(2)27? + -+ x(k) ++ 


entonces x(kT) o x(k) es el coeficiente del término z*. Por lo tanto, los valores de x(XT) o x(k) para k 
= 0, 1,2,... se pueden determinar por inspección. 

Si X(z) está dada en la forma de una función racional, la expansión en una serie de potencias 
infinita en potencias crecientes de z”* se puede lograr sencillamente al dividir el numerador entre el 
denominador, donde tanto el numerador como el denominador de X(z) se escriben en potencias 
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crecientes de 7!. Si la serie resultante es convergente, los coeficientes de los términos z* son los 
valores x(ÁT) de la secuencia del tiempo o los valores x(k) de la secuencia de números. 

Aunque este método da como resultado los valores de x(0), (7), x(2 T), . . . o los valores x(0), 
x(1), xQ), . . . de una manera secuencial, por lo regular es difícil obtener una expresión para el 
término general a partir de un conjunto de valores de x(kT) o x(k). 


Ejemplo 2-10 
Encuentre x(k) para k=0, 1, 2, 3, 4, cuando X(=) está dada por 


10z +5 

(z — DG - 0.2) 

Primero, X(z) se rescribe como un cociente de polinomios en 7”', como sigue: 
10z* + 527? 

1- 1.22 + 0.227? 


X(z) = 


X(2) = 


Al dividir el numerador entre el denominador, se tiene 
107 * + 172? + 18.42? + 18.682 * + --- 
1 — 1.22 + 0.22 ?)10z* + Sz? 


1027} — 122? +22? 
172? - 22? 


172? — 20.42? + 3.47 * 
18.42? — 3,4z* 
18.42? — 22.082 ~t + 3.682 * 
18.682 7* — 3.685 
18.682 * — 22.4162 7? + 3.7367 * 


De este modo, 
X(z) = 102 * + 1727? + 18.42? + 18.682 *++-- 


Al comparar esta expansión de X(z) en una serie infinita con X(z) = xr, se obtiene 


x(0) =0 
x(1) = 10 
x(2) = 17 
x(3) = 18.4 
x(4) = 18.68 


Como se ve a partir de este ejemplo, el método de la división directa se puede llevar a cabo 
mediante cálculos manuales si sólo se desean los primeros términos de la secuencia. En general, el 
método no produce una expresión en forma cerrada para x(k), excepto en casos especiales. 


Ejemplo 2-11 
Encuentre x(k) cuando X(z) está dada mediante 
1 z5! 


MOST r 





Al dividir el numerador entre el denominador, obtenemos 


z`! 
me e de er e 





X(z) = 
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Al comparar esta expansión de X(=) en una serie infinita con X(=) = y x(k)z*. se obtiene 


k=0 


x(0)=0 
x(1) = 1 
x(2) = -1 
x(3) = 1 
x(4) = -1 
Ésta es una señal alternante entre 1 y —1, que empieza en k= 1. En la figura 2-4 se muestra una gráfica de 
esta señal. 
Ejemplo 2-12 


Obtenga la transformada - inversa de 
X(z}= 1 +227! +32? +42? 


La transformada X(=) ya está en la forma de una serie de potencias de 7*. Puesto que X(z) tiene un 
número finito de términos, corresponde a una señal de longitud finita. Por inspección se encuentra que 


x(0) = 1 
x(1) = 2 
x(2) = 3 
x(3) = 4 


Todos los otros valores de x(k) son cero. 


Método computacional. A continuación se presentan dos enfoques de cálculo para obtener 
la transformada z inversa. 


1. El enfoque de MATLAB 
2. El enfoque de la ecuación en diferencias 


Considere un sistema G(z) definido mediante 


ce 0.4673z* — 0.3393z ? 
1 — 1.53272* + 0.660727? 


Para encontrar la transformada z inversa, se utiliza la función delta de Kronecker ô (kT ), donde 


(2-19) 


Figura 2-4 Señal alternante de | a—1 comenzando 
enk= 1. 
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O 
O 


KT) =1, parak=0 
=0, para k + 0 
Suponga que x(k), la entrada al sistema G(z2), es la entrada delta de Kronecker, o 
x(k)=1, para k=0 
=0, para k # 0 
La transformada z de la entrada delta de Kronecker es 
X(z)=1 
Mediante la entrada delta de Kronecker, la ecuación (2-19) se puede rescribir como 


Y(z) _ 0.467327' — 0.33932? 
X(z) 1- 1.5327z ' + 0.6607z* 
0,4673z — 0.3393 
= A A RA -20 
z? — 1.5327z + 0.6607 (ecan) 

Enfoque de MATLAB. Se puede utilizar MATLAB para encontrar la transformada z inversa. A 
partir de la ecuación (2-20), la entrada X(z) es la transformada z de la entrada delta de Kronecker. En 
MATLAB la entrada delta de Kronecker está dada por 





G(z) = 


x= [1  zeros(1,N)] 


donde N corresponde al final de la duración del tiempo discreto del proceso considerado. 
Puesto que la transformada z de la entrada delta de Kronecker X(=) es igual a la unidad, la 
respuesta del sistema a esta entrada es 


roces 0.4673z7! — 0.3393z ? _ __0.4673z — 0.3393 
1 - 1.53272* + 0.66072? z? — 1.5327z + 0.6607 


Por lo tanto, la transformada z inversa de G(=) está dada por 3(0), y(1),,(2), . - . . Se obtendrá x(k) hasta 
k=40. 

Para obtener la transformada z inversa de G(=) con MATLAB, se procede como sigue: Introduz- 
ca el numerador y el denominador de la siguiente forma: 


num = [0 0.4673 —0.3393]J 
den = [1 —1.5327 0.6607] 


Introduzca la entrada delta de Kronecker. 

x= [}_ zeros(1,40) 
Luego introduzca el comando 

y = filter(num,den,x) 


para obtener la respuesta p(k) desde k = 0 hasta k = 40. 
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En resumen, el programa para MATLAB que permite obtener la transformada z inversa o la 
respuesta a la entrada delta de Kronecker es como se muestra en el programa para MATLAB 2-1. 





Programa para MATLAB 2-1 





% — Para encontrar la transformada z inversa ———— 





% ***** Encontrar la transformada z inversa de G(z) es lo mismo que 
% encontrar la respuesta del sistema Y(z)/X(z) = Gíz) a la 
% entrada delta de Kronecker ***** 


RARA 


% ***** Introducir el numerador y denominador de Gíz) 


num=(0 0.4673 -0.3393); 
den=[1 -1.5327 0.6607); 


% ***** Introducir la entrada delta de Kronecker x y el comando de filtro 
% y = filter (num, den, x) ***** 


x=(1  zeros(1,40)); 
y = filter(num,den,x) 








Si este programa se ejecuta, la pantalla mostrará la salida y(k) desde k = 0 hasta 40 como sigue: 












Columns 1 through 7 
O 0.4673 0.3769 0.269 0.1632 0.0725 0.0032 
Columns 8 through 14 
—0.0429 —0.0679 —0.0758 —0.0712 —0.0591 —0.0436 —0.0277 
Columns 15 through 21 
—0.0137 —0.0027 0.0050 0.0094 0.0111 0.0108 0.0092 
Columns 22 through 28 
0.0070 0.0046 0.0025 0.0007 -0.0005 —0.0013 —0.0016 
Columns 29 through 35 
—0.0016 —0.0014 —0.0011 -—0.0008 —0.0004 —0.0002 0.0000 
Columns 36 through 41 
0.0002 0.0002 








0.0002 0.0002 0.0002 0.0001 





(Observe que los cálculos en MATLAB comienzan a partir de la columna 1 y terminan en la columna 
41, en lugar de comenzar en la columna 0 y terminar en la 40.) Estos valores dan la transformada z 
inversa de G(z). Esto es, 


y(0)=0 

y(1) = 0.4673 
y(2) = 0.3769 
y(3) = 0.2690 
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y(40) = 0.0001 


Para graficar los valores de la transformada z inversa de G(z), se sigue el procedimiento si- 
guiente. 


Graficación de la respuesta a la entrada delta de Kronecker. Considere el sistema dado por 
la ecuación (2-20). Un posible programa para MATLAB que permite obtener la respuesta de este 
sistema a la entrada delta de Kronecker se muestra en el programa para MATLAB 2-2. La gráfica 
correspondiente se muestra en la figura 2-5. 


Programa para MATLAB 2-2 | 


% 














Respuesta a la entrada delta de Kronecker 


num = [0 0.4673 -0.3393]; 
den=[1 -1.5327 0.6607]; 
x=[1  zeros(1,40)); 

v=[0 40 -1 1) 

axis(v); 

k = 0:40; 

y = filterínum,den,x); 

plot(k,y'o') 

grid 

title (Respuesta a la entrada delta de Kronecker') 
xlabel('k') 

ylabel('y(k)) 





Respuesta a la entrada delta de Kronecker 


—— PS A A A _— 





| 











-0.2 J 

-0.4 1 

a J 

sel 

e 5 10 5 20 25 30 35 40 
k 


Figura 2-5 Respuesta del sistema definido por la ecuación (2-20) a la entrada delta. 
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Si se desea conectar los puntos consecutivos (abrir círculos, o) mediante líneas rectas, se 
necesita modificar el comando de graficación de (k, y, o) en el de (k, y, *o”, k, y, *-”). 


Enfoque de la ecuación en diferencias. Al observar que la ecuación (2-20) se puede escribir 
como 


(z? — 1.53272 + 0.6607) Y (z) = (0.4673z — 0.3393) X (2) 
esta ecuación se puede convertir en una ecuación en diferencias como sigue: 
y(k + 2) — 1.5327y(k + 1) + 0.6607y(k) 


= 0.4673x(k + 1) — 0.3393x(k) (2-21) 


donde x(0) = 1 y x(k) = 0 para k + 0, y y(k) =0 para k < 0. [x(k) es la entrada delta de Kronecker.] 
Los datos iniciales y(0) y y(1) se pueden determinar como sigue: mediante la sustitución de k = 
—2 en la ecuación (2-21), se encuentra que 


y(0) — 1.5327y(-1) + 0.6607y(-2) = 0.4673x(-1) — 0.3393x(-2) 
a partir de la cual se tiene 


y(0)=0 


Después, mediante la sustitución de k = —1 en la ecuación (2-21), se obtiene 


y(1) — 1.5327y(0) + 0.6607y(-1) = 0.4673x(0) — 0.3393x(-1) 
a partir de la cual se tiene 


y(1) = 0.4673 


Encontrar la transformada z inversa de Y(z) se convierte ahora en el problema de resolver la siguiente 
ecuación en diferencias para y(k): 


y(k + 2) — 1.5327y(k + 1) + 0.6607y(k) 
= 0.4673x(k + 1) — 0.3393x(k) (2-22) 


con los datos iniciales y(0) = 0, y(1) = 0,4673, x(0) = 1, y x(k) = 0 para k + 0. La ecuación (2-22) se 
puede resolver fácilmente a mano, o mediante el uso de BASIC, FORTRAN o algún otro lenguaje de 
programación. 


Método de expansión en fracciones parciales. El método de expansión en fracciones par- 
ciales que se presenta aquí y que es idéntico al método de expansión en fracciones parciales que se 
utiliza en la transformada de Laplace, es muy empleado en problemas rutinarios que involucran trans- 
formadas z. El método requiere que todos los términos de la expansión en fracciones parciales se 
puedan reconocer fácilmente en la tabla de pares de transformadas z. 

Para encontrar la transformada z inversa, si X(z) tiene uno o más ceros en el origen (z = 0), 
entonces X(z)/z o X(z) se expande en la suma de términos sencillos de primero o segundo orden 
mediante la expansión en fracciones parciales y se emplea una tabla de transformadas z para encon- 
trar la función del tiempo correspondiente para cada uno de los términos expandidos. Se debe obser- 
var que la única razón de que se expanda X(z)/z en fracciones parciales es que cada uno de los 
términos expandidos tenga una forma que se pueda encontrar fácilmente a partir de las tablas de 
transformadas z de que se dispone comúnmente. 
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Ejemplo 2-13 
Antes de estudiar el método de expansión en fracciones parciales se revisará el teorema de corrimiento. 
Considere la siguiente X(z}: 


=4 
z 
M0 = 


Escribiendo zX(z) como Y(z), se obtiene 


2x2) = Y) = 
Con referencia a la tabla 2-1, la transformada z inversa de Y(z) se puede obtener como sigue: 
Z"[Y(2)] = y(k) = af 
Por lo tanto, la transformada z inversa de X(z) = 7* Y(z) está dada por 
Z[X(2)] = x(k) = y(k — 1) 


Puesto que se supone que y(k) es cero para toda k < 0, se tiene 


_]y(k-1)=a"7',  k=1,2,3,... 
+06) h k<0 


Considere X(=) como dada mediante 


boz” + biz™! +- bo 12 + bm 


X(z)= 
(z) z" + az! +>- + aiz + 4, 


š msan 
Para expandir X(z) en fracciones parciales, primero se factoriza el polinomio del denominador de 
XA(-=) y se encuentran los polos de X(z): 


X(2) = boz™ + biz™™ +-+. bo 12 + bp 
(z = pi)(z — p2) ++: (z — pa) 

Luego se expande X(z)/z en fracciones parciales, de manera que cada uno de los términos sea recono- 
cido fácilmente en una tabla de transformadas z. Sin embargo, si se utiliza el teorema de corrimiento 
para tomar la transformada z inversa, se debe expandir X(z) en fracciones parciales, en lugar de X(2)/z. 
La transformada z inversa de X(z) se obtiene como la suma de las transformadas z inversas de las 
fracciones parciales. 

Un procedimiento de uso muy común para los casos donde todos los polos son diferentes y 
hay por lo menos un cero en el origen (esto es, b,, = 0) es dividir ambos miembros de X(z) entre z y 
entonces expandir X(z)/z en fracciones parciales. Una vez que X(z)/z se ha expandido, ésta será de la 
forma 





X(z a a 
X(2) = 1 + PE + ..+ On 

z Z-P 27P Z — Pn 
El coeficiente a, se puede determinar multiplicando ambos miembros de esta última ecuación por 2- p, 
y haciendo que z = p,. Esto dará como resultado que todos los términos del segundo miembro sean 
cero excepto el término a,, en el cual el factor que está multiplicando z — p, ha sido cancelado por el 


denominador. Por lo tanto, se tiene 
X(z 
a; = E — pia | 


2=Pj 
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Observe que dicha forma para determinar a, es válida sólo para polos simples. 
Si X(2)/z involucra un polo múltiple, por ejemplo, un polo doble en z = p, y no tiene más polos, 
entonces X(z)/z tendrá la forma 
X(z) Ci c2 
z (Z-pY 2-P1 





Los coeficientes c, y c, se determinan a partir de 


am [eat] 


z 


ìi = lale = pyl 


Se debe observar que si X(z)/z involucra un polo triple en z = p,, entonces las fracciones parciales 
deben incluir un término (z + p,)/(z ~ py. (Véase el problema A-2-8.) 





` Ejemplo 2-14 
Dada la transformada z 
(1-e Dz 
C-e- e 
donde a es una constante y T es el período de muestreo, determine la transformada z inversa x(47) 


utilizando el método de expansión en fracciones parciales, 
La expansión en fracciones parciales de X(z)/z se tiene que es 


a e R 


z z—-1 z-e 


X(2) = 


De este modo, 


1 1 
l=zZ* 





X(z) = 


A partir de la tabla 2-1 se encuentra 





Por lo tanto, la transformada z inversa de X(z) es 
x(kT) =1-e *, k =0,1,2,... 


Ejemplo 2-15 
Obtenga la transformada z inversa de 
z +z+2 


A= (z -1z -z +1) 


mediante el método de expansión en fracciones parciales. 
Se puede expandir X(z) en fracciones parciales como sigue: 


4 -32+2 _ 4z” -32 14227? 
z=1 zZ2z+1 1-2? 1-2 +27? 
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Si observamos que los dos polos involucrados en el término cuadrático de esta última ecuación son 
complejos conjugados, X(=) se rescribe como sigue: 





477 z™ 0.577? 0.577? 
= —— — — + — 
ALa =z (ES +23?) 1-2 +z? 
1 10.52” 0.5z7* 
E if bs A A + A e A 
4z 1-=z`' x Leza? 12 ez? 
Puesto que 
1-e 2” coswT 
>f,akT xt -_ _ _- _ e 
Z le cos wkT] LT cosa Te “Tz? 


e 2 senwT 


2e “z*coswuT+e z7? 
al identificar e™" = 1 y cos WT => en este caso, se tiene wT = 77/3 y sen wT = V3 /2. Por lo que se obtiene 


sl ALS a KT 


Z [e77 senwkT] = je 


E 


S O ES osal E E JO a _ kr 
rhe Sa v31-=z' +27? Ya! E 


De este modo, se tiene 


x(k) = 4047) = 30) cos 27 -Dz + He gt Da E 
Al rescribir, obtenemos 
EEES ESTA e 


TE EA n 3 j 
0, k=0 


Los primeros valores de x(k) están dados por 


x(0)=0 
x(1)=1 
x(2)=3 
x(3)=6 
x(4) =7 


x(5) =5 


Observe que la transformada z inversa de X(=) también se puede obtener como sigue: 





1 4 zi z 
a sa pae A A 
EIA e (E Ra) 1=2 +27? 


S E L k=1,23... 
Pa — | = 
l1=z" 0 k<0 
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y 
-1 

>-1 2 LAR k kr 

E |] NA 
se tiene 

3 kr 4 nk Dr Š 
wf 2V3 seny + a Sen T ken 
0, k=<0 


Aunque esta solución se podría ver diferente a la que se obtuvo en un principio, ambas soluciones son 
correctas y dan los mismos valores para x(k). 


Método de la integral de inversión. Ésta es una técnica útil para la obtención de la transfor- 
mada z inversa. La integral de inversión de la transformada z X(z) está dada por 


ZMHX()] = x(kT) = x(k) = Iaf XE de (2-23) 


donde C es un círculo con centro en el origen del plano z tal que todos los polos de X(z)24* están 
dentro de él, [Para obtener la ecuación (2-23), véase el apéndice B.] 

La ecuación que da la transformada z inversa en términos de los residuos se puede obtener si se 
utiliza la teoría de la variable compleja. Ésta se puede obtener como sigue: 


X(KT) =x(k) =K,+ Kıt- + Kn 


Y [residuo de X(2)7 en el polo z = z, de Xz) "] (2-24) 
i=1 

donde K,, K,, . . . K„ denotan los residuos de X(z)2%” en los polos z,, Z», . . . , Z„, respectivamente. 
(Para obtener esta ecuación, véase el apéndice B.) Al evaluar los residuos, observe que si el denomi- 
nador de X(z)** contiene un polo simple en z = z, entonces el residuo K correspondiente está dado 
por 


K = lim [(z - 2)X(2)2*"] (2-25) 


Si X(z)2* contiene un polo múltiple z, de orden q, entonces el residuo K está dado por 


1 a d! 
a Da 
Observe que los valores de k en las ecuaciones (2-24), (2-25) y (2-26) son enteros positivos. 

Si_X(z) tiene un cero de orden r en el origen, entonces X(z)2*"' en la ecuación (2-24) involucrará 
un cero de orden r + k-— 1 en el origen. Sir > 1, entonces r + k — 120 para k 20, y no hay polo en 
z=0en X(2)2*. Sin embargo, sir < 0, entonces habrá un polo en z=0 para uno o más valores positivos 
(no negativos) de k. En tal caso, es necesaria la inversión por separado de la ecuación (2-24) para cada 
valor de k. (Véase el problema A-2-9.) 

Debe observarse que el método de la integral de inversión, cuando se evalúa por residuos, es 
una técnica muy sencilla para obtener la transformada z inversa, siempre que X(z)2*”, no tenga polos 
en el origen, z = 0. Sin embargo, si X(z)2*" tiene un polo simple o uno múltiple en z = 0, el cálculo se 
puede tornar tedioso y el método de expansión en fracciones parciales podría ser más sencillo de 


K = [(2 = z) X(2)2*"] (2-26) 
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32.:car. Por otro lado, en ciertos problemas el enfoque de expansión en fracciones parciales puede ser 
~.. laborioso. En esos casos es más conveniente el método de la integral de inversión. 


Ejemplo 2-16 
Obtenga x(kT) empleando el método de la integral de inversión cuando X(z) está dada por 
zZl-e”) 
XA = ———_—_—_ E. 
( ) (z SA DG ua en) 
Observe que 
1 De e Tyz* 
TL: 
(z)z (z eE DG T e”) 
Parak=0,1,2,..., X(2)2” tiene dos polos simples en z = 2, = 1 y 2 =2, =e", Por lo tanto, a partir de 


la ecuación (2-24), se tiene 


r 


x(k) = > [residuo de 


i=l 


a se ez E 
-De e -De e) enel poloz=z, 


=K +K 
donde 


K, = [residuo en el polo simple :z = 1] 


lee] 


K: = [residuo en el polo simple z = e™”] 


ERE = prakT 


i ime : na) dí 


Por lo tanto, 
x(k) = Ki +K,=1-e %, k=0,1,2,... 


Ejemplo 2-17 
Obtenga la transformada z inversa de 


z? 


X = a_n 
(z) (z El DY pz e”) 
empleando el método de la integral de inversión. 


Observe que 


k+l 
z 


E O aa 


Parak=0,1,2,..., X(2)2” tiene un polo simple en z = z, =e"7 y un polo doble en z= 2, = 1. Por lo tanto. 
a partir de la ecuación (2-24), se obtiene 


> 


x(k) = Y residuo de 


i=l 


k+1 


z r= u 
G-I- eT en pa] 


= K, + Ka 
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donde 
K, = [residuo en el polo simple z= e “] 
k+1 -a(k+1)T 
= * = per (A = pe 
e sim, |e E YE - Dz - zm -eF 
Kı = [residuo en el polo doble z= 1] 
2 1 ` d 3 gin 
“== a le eE Deen 
d ( gn ) 
5 FE z-e” 
| (k +1iz*(z 0 -z 
j am (z -eF 
aek e 
1 — eT ( es emy 
Por lo tanto, 
eT eT k er 
xMkT) =K, + K= U- eF + 1-7 Mery 
ar, — pakT 
Er eO O DI 


2-6 MÉTODO DELA TRANSFORMADA z PARA LA SOLUCIÓN 
DE ECUACIONES EN DIFERENCIAS 


Las ecuaciones en diferencias se pueden solucionar fácilmente mediante el uso de una computadora 
digita!, siempre que se proporcionen los valores numéricos de todos los coeficientes y los parámetros. 
Sin embargo, las expresiones en forma cerrada para x(k) no se pueden obtener a partir de la solución 
por computadora, excepto para casos muy especiales. La utilidad del método de la transformada z es 
que permite obtener la expresión en forma cerrada para x(k). 

Considere un sistema en tiempo discreto, lineal e invariante en el tiempo caracterizado por la 
siguiente ecuación en diferencias: 


x(k) + ayx(k — 1) ++ +a,x(k — n) 
= byu(k) + bju(k — 1) + ++ + b,u(k — n) (2-27) 


donde u(k) y x(k) son la entrada y salida del sistema, respectivamente, en la k-ésima iteración. Al 
describir dicha ecuación en diferencias en el plano z, se toma la transformada z de cada uno de los 
términos en la ecuación. 

Defínase 


Z[x(k)] = X(2) 
Entonces x(k + 1), x(k + 2), x(k +3), ... y x(k — 1), x(k — 2), x(k — 3), . . . se pueden expresar en 
términos de X(z) y de las condiciones iniciales. Sus transformadas z exactas se obtuvieron en la 
sección 2-4 y se resumieron en la tabla 2-3 por conveniencia. 
A continuación se presentan dos problemas como ejemplo de la solución de ecuaciones en 
diferencias mediante el método de la transformada z. 
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TABLA 2-3 TRANSFORMADAS z DE x(k + m) Y x(k- m) 


Ejemplo 2-18 
Resuelva la siguiente ecuación en diferencias empleando el método de la transformada z: 


x(k + 2) + 3x(k + 1) + 2x(k) = 0, x(0) =0, x(1) = 1 
Observe primero que las transformadas z de x(k + 2), x(k + 1) y x(ķ) están dadas, respectivamente, 
Z{x(k + 2)] = 2X(2) — 24x(0) — zx(1) 
ZÍlx(k + 1)] = 2X(2) — zx(0) 
Zlx(k)] = X(2) 


Al tomar las transformadas z de ambos miembros de la ecuación en diferencias dada, se obtiene 
z? X(2) — 22x(0) — zx(1) + 32X (2) — 3zx(0) + 2X(z) = 0 




















por 


Al sustituir las condiciones iniciales y simplificar, se obtiene 


z z E E 
Aee aaa eT er rl 2+2 
1 1 





+21 1+227 
Si se observa que 





>-1 1 = (y 1 1 = (_9y 
zitl- en ala] 
se tiene 

x(k) = (-D' — ar, k = (738% CA 


Ejemplo 2-19 
Obtenga la solución de la siguiente ecuación en diferencias en términos de x(0) y x(1): 


x(k + 2) + (a + bix(k + 1) + abx(k) = 0 


donde a y b son constantes y k=0,1,2,.... 
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La transformada z de esta ecuación en diferencias está dada por 


[2 X(2) — 2?x(0) — zx(1)] + (a + b)[2X(2) — zx(0)] + abX(z) = 0 


[2? + (a + b)z + ab]X(z) = [2* + (a + b)z]x(0) + zx(1) 
Al resolver esta última ecuación para X(z) se obtiene 
_ [z7 + (a + byz]x(0) + zx(1) 
ar z? + (a + b)z + ab 


Nótese que las constantes a y b son los negativos de las dos raíces de la ecuación característica. Ahora se 
considerarán dos casos por separado: a)a Fbyb)a=b. 
a) Para el caso donde a + b, al expandir M(2)/z en fracciones parciales, se obtiene 


X(2) a bx(0) + x(1) 1 i ax(0) + x(1) 1 





z b-a z+a a-b z+b’ aE 
a partir de lo cual se obtiene 
_ bx(0) + x(1) 1 ax(0) + x(1) 1 
Xz) = b-a braz aeb 1+ bz™' 
La transformada z inversa de X(z) da como resultado 
_ bx(0)+x(1) e. ax(0) + x(1) A 
x(k) = —5 z; Ctp CO, a+b 
donde k= 0, 1,2,.... 
b) Para el caso donde a = b, la transformada z de X(z) se convierte en 
_ (27 + 2az)x(0) + zx(1) 
ALERS z? + 2az + a? 
_ zx(0) Pe z[ax(0) + x(1)) 
=z+a (z + ay 
_  x(0) A [ax(0) + x(1)]z* 
1+az™' (1 + az y 
La transformada z inversa de X(z) da como resultado 
x(k) = x(0)(a) + [ax(0) + x(1)]k(-aJ", a=b 


donde k=0,1,2,.... 


2-7 COMENTARIOS FINALES 


En este capítulo se ha presentado la teoría básica del método de la transformada z. La transformada 
z tiene el mismo propósito para sistemas en tiempo discreto, lineales e invariantes en el tiempo que 
la transformada de Laplace para sistemas en tiempo continuo, lineales e invariantes en el tiempo. 
El método por computadora para el análisis de datos en tiempo discreto da como resultado 
ecuaciones en diferencias. Con el método de la transformada z, las ecuaciones en diferencias lineales 
e invariantes en el tiempo se pueden transformar en ecuaciones algebraicas. Esto facilita el análisis 
de la respuesta transitoria de los sistema de control digital. También, el método de la transformada z 
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zermite el uso de las técnicas convencionales de análisis y diseño disponibles para sistemas de 
¿Tirol analógicos (en tiempo continuo), tales como la técnica del lugar geométrico de las raíces. El 
z-351sis y diseño mediante la respuesta en frecuencia se puede llevar a cabo si se convierte el plano z 
37 el plano w. Asimismo, la ecuación característica transformada en el dominio de z permite aplicar una 
=rueba sencilla de estabilidad, tal como el criterio de estabilidad de Jury. Estos temas se estudiarán 


zon detalle en los capítulos 3 y 4. 


PROBLEMAS DE EJEMPLO Y SOLUCIONES 


Ejemplo A-2-1 
Obtenga la transformada z de G*, donde G es una matriz constante de n x n. 


Solución Por definición. la transformada z de G‘ es 


Z[6*] = Y G*z* 
k=0 


=I + Gz! 4+G2*4+GÓz2*+>-> 


= (I ~- Gz 
=(21-G)'z 
Observe que G' se puede obtener tomando la transformada z inversa de (I — Gz'y' o (z1 - GY! z. 
Esto es, 
G* =Z "(1 -Gz y] =2"[(1-G)*2] 
Ejemplo A-2-2 


Obtenga la transformada z de K. 
Solución Por definición, la transformada z de A? es 


Z[k]= E k?z = z +42? +92? + 167 * ++ *- 


k=0 


2 (142 DA +32 462774102? + 1527 + ---) 
EZ 

(ly 

Aquí se ha empleado la expresión en forma cerrada (1 — 7"*)* para la serie infinita involucrada en el 
problema. (Véase el apéndice B.) 


Ejemplo A-2-3 
Obtenga la transformada z de ka mediante dos métodos. 


Solución 
Método 1. Por definición, la transformada z de ka'”! está dada por 


Z [ka*="] = Y kat! z~ 
k=0 
=z + 2az 43402 + 4a°z™* +. 
=z27'(1 + 2az™' + 3a?°z™? + 4a°z™° + -) 
aea 
( - az y 
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Método 2. La expresión mediante la sumatoria para la transformada z de ka*' también se puede escribir 


como sigue: 
5 a y -k 
Z [ka] = Y ka" 27*=a $, ka“ z™* = iş e(z) 
k=0 k=0 âk=0 MA 
1 (za)? ON z7 
a [1 — (zla) P (1 — az~}? 
Ejemplo A-2-4 


Muestre que 





z| 3:00] 25 Ix) 


z| 3x0] = -Z x(2) 


h=0 =z“ 
y 
x(k) = lim X(2) (2-28) 
k=0 z>1 
También muestre que 
k i—1 
Z 2 0] = lro - y z| (2-29) 
h=i l-z h=0 


donde I <Si<k-l. 
Solución Defina 


k 


y(k)= È x(h),  k=0,1,2,... 


de modo que a 
y(0) = x(0) 
y() = x(0) + x(1) 
yQ) = x(0) + x(1) + x(2) 


y(k) = x(0) + x(1) + x(2) + +- + x(k) 
Entonces, es claro que 
y(k) — y(k — 1) = x(k) 


Si escribimos fas transformadas z de x(k) y y(k) como X(z) y Y(z), respectivamente, y tomamos la 
transformada z de esta última ecuación, se tiene 


Y(2) - 2 Y(z) = X(z) 
Por lo tanto, 


Y(z) = axe) 


-z` 
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z| $+% ==11001= Y(2) == 5x0) 
y 
2 3x0] - ZLD-D]=2"Y0) = axe) 


Al emplear el teorema del valor final, se encuentra que 





lim y(k) = lim [š s] = lim la iah 1x0) 


x 


y x(h) = Y x(k) = lim X(2) 


Después, para probar la ecuación (2-29), primero se define 


k 


YU) = © x(h) = x(i) + x(i +1) +- + x(k) 


h=i 
donde 1 < į < k— 1. Defina también 
Ž (z) =x(02 + x(i + D2 09 + e +x(k)2* + 


Entonces, al observar que 


x 


X(2) = Z [x(k)] = 2 x(k)2* = x(0) + x(1)z™ + x(2)z + 


se obtiene 
ii 


X(2) = X(z)- 27 
Puesto que 
Y(k) — y(k — 1) = x(k), k=i5i+1,i+2,... 
la transformada z de esta última ecuación se convierte en 
Y(z) - 2'Y(z) = X(2) 
[Observe que la transformada z de x(k), que empieza con k = i, es X (2), no X(=).] Así, 


2] Em] - Y) = 540) = 25 [xo - Ex] 


h=i h=0 
Ejemplo A-2-5 
Obtenga la transformada z de la curva x(t) que se muestra en la figura 2-6. Suponga que el período de 
muestreo T es } seg. 


Solución A partir de la figura 2-6 se obtiene 


x(0)=0 

x(1) = 0.25 
x(2) = 0.50 
x(3) = 0.75 


x(k)=1, k=4,5,6,... 
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x(t) 





0.5 


Figura 2-6 Curva x(1). 





Entonces la transformada z de x(k) se puede dar mediante 


ES 


X(2)= Y x(k)z* 


k=0 
= 0.252 + 0.5027? + 0.752 ° + z^ +z 5 +z 6+. 


O.2S(z7? + 22724327) + 20% — 





zaz taz 


i 


4(1 - 27°) 
o1z (+z A -2 
4 0 ==" 
REA 
4 (1-z "y 


Nótese que la curva x(1) se puede escribir como 
x(t) = 31 — ¿(0 4)1(1 — 4) 


donde 1(+— 4) es la función escalón unitario que se presenta en ¢ = 4. Puesto que el período de muestreo 
es T= 1 seg, la transformada z de x(£) también se puede obtener como sigue: 


X(2) =Z (x(0] =2 1] -ZEE — 416 — 4)] 


A AA 
4(1-z2"? 4(1-z2 "Y 

E LME 

4 (1-2 

N Ejemplo A-2-6 
Considere X(z), donde 
227 +2 
0 =D =D 


Obtenga la transformada z inversa de X(z). 


Solución Se expandirá X(z)/z en fracciones parciales como sigue: 
X(2) 227 +1 9 1 3 
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Entonces 


(1-22 Y? 1-22 


Las transformadas z inversas de los términos individuales dan 


>-1 z k-1 
Z [l-e ), k=0,1,2,... 


(1 - 22 Y 
1 
o e] =k 2 
i ES 2 k 0,1,2,... 
>-11 1 E 
a f - al =i 
y por tanto 
x(k) = 9k(2") -24 +3, k= 0,1,2,... 
Ejemplo A-2-7 
Obtenga la transformada z inversa de 
z+2 
AUNA (z — 2)z? 


Solución Al expandir X(=) en fracciones parciales, se obtiene 
1 1 1 JA 
[Observe que en este ejemplo, X(=) involucra un polo doble en == 0, Por lo que la expansión en fracciones 


parciales debe incluir los términos 1/(=?) y 1/-.] Refiriéndose a la tabla 2-1, se encuentra la transformada z 
inversa de cada uno de los términos de esta última ecuación, Esto es, 


=1 Kk-1 
> 22 1_J]2, k=1,2,3,... 
dl SB k=0 
>s-23-_)1, k=2 
A k+2 
>ap-_)1 k=1 
e pieh k+1 
Por tanto, la transformada z inversa de X(=) puede darse mediante 
0-0-0= 0, k=0 
_}i-0-1=0, k=1 
A k=2 
27 -0-0=2) k =3,4,5, 


Al rescribir, se tiene 


0, k=0,1 
x(k) =41, k=2 
21. k=3,14,5,... 


Para verificar este resultado, se podría aplicar el método de la división directa a este problema. Notando 
que 
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z+2 z7? + 2z 


DDR I 
=z? +42 +82 *+ 167 * + 3277% +- 


= 274 (2)? + (25 (25 1)205 + (26 + 


x( 


se encuentra que 


0, k=0,1 
x(k) = $41, k=2 
2% k =3,4,5, 
Ejemplo A-2-8 
Obtenga la transformada z inversa de 
z? 
X(2) Ar ( E ZU y 


Solución La transformada z inversa de z?/(1 — z"*Y no está disponible en la mayoría de la tablas de 
transformadas z. Sin embargo, es posible escribir la X(z) dada como una suma de transformadas z que, por 
lo regular, se encuentran en las tablas de transformadas z. Puesto que el denominador de X(z) es (1 —z "Y 
y la transformada z de Pes (1 + z°)/(1 —2 Y, rescríbase X(z) como 


qa lla) En 
X(z) = ü- zy = a- Z Y 7 G- 2 Y 
CAMA E 
a Q- z` 
o 
2? 2 (M1+z20) Zn z7? 


-zP a-y U-nr Y 0-7 
a partir de lo cual se obtiene la siguiente expansión en fracciones parciales: 


O CL a do EOI 

Any 2| Aa-2= Y? (1-2 
Las transformadas z de los dos términos del segundo miembro de esta última ecuación se pueden encontrar 
en la tabla 2-1. Así, 


=> 1 1 
k) = ZN HG = 5 (kk) =5k(k - 1 k= pis 
x( ) la qe zy z% ) 2 ( ), 0,1,2, 
Se debe observar que si la X(z) dada se expande en otras fracciones parciales, entonces la transfor- 
mada z inversa no se podrá obtener. 
Como un enfoque alternativo, la transformada z inversa de X(z) podrá obtenerse mediante el mé- 
todo de la integral de inversión. Primero, observe que 


z* 


(2 -1y 
Por lo tanto, parak=0, 1,2,..., X(z)z*, tiene un polo triple en z = 1. Con referencia a la ecuación 
(2-24), se tiene 


X= 


; en el polo triple z=z, | 


z* 
x(k) = | residuo dF 
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O A j ARA 
= 67 simple - 1) GIF 2 >| 


= 2 tim (2 
-å k-1 
jine) 


= > lim [k(k — D22] 


1 
=5k(k-1), k =0,1,2,... 


Ejemplo A-2-9 
Con el método de la integral de inversión, obtenga la transformada z inversa de 
10 
CEDE) 
Solución Observe que 
107** 
kafo 
dE PETERS 
Para k = 0, nótese que X(z)z *' se convierte en 
10 
A ————————X k=0 
e (z - 1)(z - 2)” 
Por lo tanto, para k = 0, xek + tiene tres polos simples, z = 2, = 1, z =2,=2yz=z,=0. Parak = 1.2, 
Jaras : sin embargo, X(=)2* tiene sólo dos polos simples, z = 2, = 1 yz=2=2. Por lo tanto, se debe 


considerar x(0) y x(k) (donde k= 1, 2, 3, . . . ) por separado. 


Parak=0. Para este caso, con referencia a la ecuación (2-24), se tiene 


3 
10 
x(0) = 2 residuo de E-DE =D NM el polo ===, | 
= K; + K: + K, 
donde 


K, = [residuo en el polo simple z = 1 


10 e 
j imle NE = AN 


K2 = [residuo en el polo simple z = 2] 


10 E 
ame) 


K; = [residuo en el polo simple z= 0] 


10 a 


www.FreeLibros.me 


62 La transformada z Capítulo 2 


Por lo tanto, 
x(0) = K, + K: + K3=-10+5+5=0 
Para k= l, 2, 3,.... Para este caso, la ecuación (2-24) se convierte en 
2 k-1 
; 10z ÉL 
x(k) = È [residuo de E-DE=I el poloz=z, | 
— K, + Kə 
donde 
K, = [residuo en el polo simple z = 1] 
10247! 
= li = DY | = -10 
n [e DGE- 5 
K, = [residuo en el polo simple z = 2] 
10z*7* 
=li - Y ] = 1027! 
ce E DE=DE= 5] a 
Así, 


x(k) = K, + K: = -10+ 10(2*7*) = 10(2** — 1), k=1,2,3,... 
Por lo tanto, la transformada z inversa de la X(z) dada se puede escribir como 


Jo, k=0 
TETTE ki 


Una forma alterna para escribir x(k) para k > 0 es 


x(k) = S8A(k) + 10(2** — 1)  k=0,1,2,... 


donde 8,(k) es la función delta de Kronecker y está dada por 


1 parak=0 
k)= jg 
A lo para k # 0 
Ejemplo A-2-10 

Obtenga la transformada z inversa de 

E z(z + 2) (2-30) 

X(z) (z E, 1y 

empleando los cuatro métodos que se presentaron en la sección 2-5. 
Solución 
Método 1: método de la división directa. Primero se rescribe X(z) como un cociente de dos polinomios en 
AE 


1+2z7° _— 1+2z` 
xz) = A=z2 1-2z'+z”? 


Al dividir el numerador entre el denominador, se obtiene 
X(2) =1+42 +77? + 107° +.. 
Por lo tanto, 


x(0)=1 
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x(1) =4 
xQ) =7 


x(3) = 10 


Método 2: método computacional (enfoque de MATLAB). La X(=) se puede escribir como 


2 
27 +22 
X(2) = 5 
(2) 2—22+1 
Por lo tanto. la transformada - inversa de X(=) se puede obtener con MATLAB como sigue: 
Defina 
num=[(1 2 0] 
den =[1 -2 1] 
Si se desean los valores de x(k) parak=0, 1,2,..., 30, entonces introduzca la entrada delta de Kronecker 
como Sigue: 


u = [1  zeros(1,30)) 


Luego introduzca el comando 
x = filter(num,den,u) 


Véase el programa para MATLAB 2-3. [La pantalla mostrará la salida x(x) desde k = 0 hasta k = 30.] (Los 
cálculos de MATLAB comienzan desde ła columna 1 y terminan hasta la columna 31. en lugar de empe- 





Programa para MATLAB 2-3 





num=[1 2 0) 
den=[1 -2 1); 
u=|[1 zeros(1,30)); 
x = filter(num,den,u) 
x= 
columns 1 through 12 


1 4 7 10 13 16 19 22 25 28 31 34 


Columns 13 through 24 


u 
54] 
va 
œ 
DD 
= 


37 40 43 46 49 52 64 67 70 
Columns 25 through 31 


73 76 79 82 85 88 91 
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zar en la columna 0 y terminar en la 30.) Los valores de x(k) dan la transformada z inversa de X(z). Esto es, 


x(0) =1 
x(1) =4 
x(2) =7 
x(30) = 91 
Método 3: método de la expansión en fracciones parciales. Se expande X(z) en las siguientes fracciones 
parciales: 
z(2 +2) _ 3z 1 327 z 
anme — t —— = 1 +- t 
tiren ea 1. arre 


Entonces, si advertimos que 


, 


E k =0,1,2,... 
z ES Zy) k, 

>-1 25 z 

S l E =] -f 


x(0)=1 
x(k)=3k +1, k=1,2,3,... 


taali O 
zn- fi k =1,2,3,... 





1, k 
0, k 


obtenemos 


que se pueden combinar en una ecuación en la siguiente forma: 
x(k) = 3k + 1, k=0,1,2,... 
Observe que si se expande X(z) en las siguientes fracciones parciales 


4 3 427 3772 
= 14 — +5 32142, + 
E r aT 


entonces la transformada z inversa de X(z) se convierte en 
x(0) = 
x(k) =4+3(k -1)=3k+1,  k=1,2,3,... 


xX(k) =3k+1,  k=0,1,2,... 


que es el mismo resultado que se obtuvo mediante la expansión de X(z) en otras fracciones parciales. 
[Recuerde que X(z) se puede expandir en diferentes fracciones parciales, pero el resultado final para la 
transformada z inversa es el mismo. ] 


Método 4: método de la integral de inversión. Primero, observe que 
Xey s 


Para k=0, 1,2, .. ., X(z)2” tiene un polo doble en z = 1. Por lo tanto, con referencia a la ecuación (2-24), 
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ene 


x(k) = [residuo de Cing en el polo doble z = 1| 


20 melo 


= = tim (( + 2)2*] 


=3k +1, k = 0,1,2,... 
Ejemplo A-2-11 
Resuelva la siguiente ecuación en diferencias: 
2x(k) — 2x(k — 1) + x(k — 2) = u(k) 
onde x(k) = 0 para k<0 y 
-11 k =0,1,2,... 
uo =lo $Z 


Solución Al tomar la transformada z de la ecuación en diferencias dada, 





2X(2) 22 X() + 27X) = 


Al resolver esta última ecuación para X(z), se obtiene 
1 1 7 
X 74 era deere tanta ara FEE A A TN ANS 
t) 1-23 12-22 +z? (z - 1)Qz2? -2z + 1) 
Al expandir X(z) en fracciones parciales, se tiene 
-z +z o 1 polt 25 

2z? -2z+1 1-2* 2-22 +2? 
Nótese que los dos polos involucrados en el término cuadrático en esta última ecuación son complejos 
conjugados. Por lo tanto, X(z) se rescribe como sigue: 


1 1 1 — 0.527 1 0.5z7? 
AUR 21- z +052? 21- z 405z° 





X(z)= 


Refiriéndose a la fórmula de las transformadas z de las funciones coseno y seno amortiguados, se identifica 
et = =0. 5 y cos wT = 1/42 para este problema. Por lo tanto, se obtiene que wT = 77/4, sen wT = 1/2, 


y e = I/42 . Entonces la transformada z inversa de X(z) se puede escribir como 
x(k) = 1 — Je? cosakT + 1e 7“? sen wkT 
k k 
1 kmr 1/1 kr 
E AE Pa — + -| — — = hs 
1 aa cos =y 12) sen 4 k=0,1,2, 


a partir de la cual se obtiene 
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x(2) = 1.25 
x(3) = 1.25 


x(4) = 1.125 


Ejemplo A-2-12 
Considere la ecuación en diferencias 


x(k + 2) — 1.3679x(k + 1) + 0.3679x(k) = 0.3679u(k + 1) + 0.2642u(k) 
donde x(k) es la salida y x(k) = 0 para k< 0 y donde u(k) es la entrada y está dada por 
u(k) = 0, k<0 


u(0) = 1 
u(1) = 0.2142 
u(2) = -0.2142 


u(k) =0, k=3,4,5,... 
Determine la salida x(k). 
Solución Al tomar la transformada z de la ecuación en diferencias dada, se obtiene 
[z7 X(z) — 2?x(0) — 2x(1)] — 1.3679[2X (2) — 2x(0)] + 0.3679X (2) 
= 0.3679(2U(2) — zu(0)] + 0.2642U(2) (2-31) 





Al sustituir k=—1 en la ecuación en diferencias dada, se encuentra que 
x(1) — 1.3679x(0) + 0.3679x(-1) = 0.36794(0) + 0.2642u(—1) 
Puesto que x(0) =x(=1) = 0 y debido a que u(-1) = 0 y u(0)= 1, se obtiene 
x(1) = 0.3679u(0) = 0.3679 
Al sustituir los datos iniciales 
x(0) = 0, x(1) = 0.3679, u(0)=1 
en la ecuación (2-31), se tiene que 
z? X(z) — 0.3679z — 1.3679zX(z) + 0.3679X(z) 
= 0.3679zU(z)} — 0.3679z + 0.2642U(2) 


Al resolver para X(z), se encuentra que 


— 236792 + 0.2642 ¿y,) 
Z? — 1.36792 + 0.3679 





X(z) 


La transformada z de Ja entrada u(k) es 
U(z) = Z [u(k)] = 1 + 0.2142z"* — 0.2142z ~? 
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Por tanto, 


Xz) = 0.3679z + 0.2642 
z? — 1.3679z + 0.3679 


E 0.3679z ~! + 0.34307"? — 0.022212 7? — 0.05659z~* 
1 — 1.367927! + 0.36792? 


= 0.367927! + 0.84632 "+2 +z% +z5 +.. 


Así. la transformada z inversa de X(z) da como resultado 


(1 + 0.21422* — 0.21422?) 


x(0)=0 
x(1) = 0.3679 
x(2) = 0.8463 


x(k)=1, k=3,4,5,... 


Ejemplo A-2-13 
Considere la ecuación en diferencias 
x(k +2) = x(k + 1) + x(k) 
donde x(0)=0 y x(1)= 1. Observe que x(2)=1,x(3)=2,x(4)=3,....Laserie 0, 1, 1, 2, 3, 5, 8, 13,... 
se conoce como serie de Fibonacci. Obtenga la solución general x(k) en una forma cerrada. Muestre que el 


valor límite de x(k + 1)/x(k), a medida que k se aproxima a infinito es (1 + 45 y/2, o aproximadamente 
1.6180. 


Solución Al tomar la transformada z de esta ecuación en diferencias, se obtiene 


2?X(2) — 22x(0) — zx(1) = zX(2) — zx(0) + X(2) 


Resolver para X(z) da como resultado 


_ Zé x(0) + zx(1) — zx(0) 
E 2=z-1 


X(z) 


Al sustitur los datos iniciales x(0) = 0 y x(1)= 1 en esta última ecuación, se tiene 














E PU 

A E EA 1 

v5 1+ V5 _, 1- V5 
1- 2 z 1- 7 z 


La transformada z inversa de X(z) es 


1h vY f1-vsY E 
TERR 3 ¡Al a y k = 0,1,2,... 


Observe que aunque esta última ecuación involucra a v5, las raíces cuadradas del segundo miembro de esta 
última ecuación se cancelan, y los valores de x(k} para k = 0, 1, 2,... resultan ser enteros positivos. 








www.FreeLibros.me 


68 La transformada z Capítulo 2 


El valor límite de x(k + 1)/x(k) a medida que k tiende a infinito se obtiene como sigue: 


( + a E E s aj” 
MK +0, 2 2 


l Š DA 


ee x(k) ko E + e] Ñ ( - a] 














2 2 
Puesto que |(1 — ÉSA <I, 





k 
lim ( +5) >0 











Por lo tanto, 
( + v5Y 
EC 2 14 V5_ 
o n E 4 2 A PR 
2 


Ejemplo A-2-14 
Con referencia al problema A-2-13, escriba un programa para MATLAB a fin de generar la serie de 
Fibonacci. Desarrolle la serie de Fibonacci hasta k = 30. 


Solución La transformada z de la ecuación en diferencias 
x(k + 2) = x(k + 1) + x(k) 
está dada por 
z’ X(2) — 22x(0) — zx(1) = 2X (2) — zx(0) + X(2) 


Al resolver para X(z) y sustituir los datos iniciales x(0) = 0 y x(1) = 1, se tiene que 
Z 
X(z) == —— 
(z) z? =z- 1 
La transformada z inversa de X(z) dará la serie de Fibonacci. 


Para obtener la transformada z inversa de X(z), obtenga la respuesta de este sistema a la entrada delta 
de Kronecker. El programa para MATLAB 2-4 dará como resultado la serie de Fibonacci. 














==] 
| Programa para MATLAB 2-4 

% Serie de Fibonacci 

Y **** La serie de Fibonacci se puede generar como la 

% respuesta de X(z) a la entrada delta de Kronecker, donde 

% X{Z) = z/(z^2 -z-1)**** 

num=(0 1 O}; 

den=[1 -1 -1); 

u=ļ]1]1  zeros(1,30)); 

x = filter(num,den,u) 

d 
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a salida filtrada y que se muestra a continuación da la serie de Fibonacci. 
x= 
Columns 1 through 6 


0 1 1 2 3 5 








Columns 7 through 12 

8 13 21 34 55 89 

Columns 13 through 18 
144 233 377 610 987 1597 

Columns 19 through 24 
2584 4181 6765 10946 17711 28657 

Columns 25 through 30 
46368 75025 121393 196418 317811 514229 


Column 31 





832040 





Observe que la columna 1 corresponde a k = 0 y la columna 31 corresponde a k = 30. La serie de 
Fibonacci está dada por 


x(0) =0 
x(1) = 1 
x(2) = 1 
x(3) = 2 
x(4) = 3 


x(5) = 5 


x(29) = 514,229 
x(30) = 832,040 


Ejemplo A-2-15 
Considere la ecuación en diferencias 


x(k +2) + ax(k +1) + Bx(k) = 0 (2-32) 
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Figura 2-7 Región del plano «f en la que la serie 
solución de la ecuación (2-32), sujeta a las 
condiciones iniciales, es finita. 





Encuentre las condiciones sobre a y ß para las cuales la serie solución de x(k) para k=0, 1,2,..., sujeta 
a las condiciones iniciales, es finita. 
Solución Defínase 

a=aw+b, B =ab 


Entonces, con referencia al ejemplo 2-19, la solución x(k) para k= 0, 1, 2, . . . puede darse mediante 


ds P) aD ay + 2 y, REP 
x(0(-aY + [ax(0) + x(1)]k(-a)"', a=b 


La serie solución x(k) para k = 0, 1, 2, ... , sujeta a las condiciones iniciales x(0) y x(1), es finita si los 
valores absolutos de a y b son menores que la unidad. Asi, sobre el plano af, se pueden localizar tres 
puntos críticos: 


a=2, = 
a=-2, = 
e =0, B= 


El interior de la región limitada por las líneas que conectan a estos puntos satisface la condición la] < 1, 
|b| < 1. Las líneas de la frontera pueden darse por 8 = 1, œa- B= 1 y a+ B=-1. Véase la figura 2-7. Si 
el punto (a, B) cae dentro de la región triangular sombreada, entonces la serie solución x(k) parak=0, 1, 
2,..., sujeta a las condiciones iniciales x(0) y x(1), es finita. 





PROBLEMAS 


Problema B-2-1 
Obtenga la transformada z de 


x(0) = 30 =e"") 


donde a es una constante. 


www.FreeLibros.me 


Tz2 “lo 2 Problemas 71 


Problema B-2-2 
Obtenga la transformada z de ki. 


Problema B-2-3 
Obtenga la transformada z de Pe”. 


Problema B-2-4 
Obtenga la transformada z de la siguiente x(k): 
x(k) = 9k(21) - 2 +3, k=0,1,2,... 
Suponga que x(k) = 0 para k < 0. 


Problema B-2-5 
Encuentre la transformada z de 


k 
x(k) = Y a 
h=0 
donde a es una constante. 
Problema B-2-6 


Muestre que 


QNz 
(z — ay 
(h!)z 


Z[k(k — 1)a*=?] = 


Z[k(k — 1) (k — h + Da**] = 


Problema B-2-7 
Obtenga la transformada z de la curva x(£) que se muestra en la figura 2-8. 


x(t) 





0.5 





Figura 2-8 Curva x(/). 


Problema B-2-8 
Obtenga la transformada z inversa de 
1 +2z + 32? + 42? + 52* 


X(2) = zê 
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Problema B-2-9 
Encuentre la transformada z inversa de 


20.52") 


XG) = 03 087 Y 


Use 1) el método de expansión en fracciones parciales y 2) el método de MATLAB. Escriba un programa 
para MATLAB para encontrar x(k), la transformada z inversa de X(z). 


Problema B-2-10 
Dada la transformada z 
z! 
(Q = z1 + 1.327? + 0.42?) 


determine los valores inicial y final de x(k). También encuentre x(k), la transformada z inversa de X(z), en 
una forma cerrada. 


X(2) = 


Problema B-2-11 
Obtenga la transformada z inversa de 


l+z*-z 
X(2) = AT 


Use 1) el método de la integral de inversión y 2) el método de MATLAB. 


Problema B-2-12 


Obtenga la transformada z inversa de 
z -3 


XO AA 0 


en una forma cerrada. 


Problema B-2-13 
Utilizando el método de la integral de inversión, obtenga la transformada z inversa de 


1+62?*+2? 
A ER E 


Problema B-2-14 
Obtenga la transformada z inversa de 
2 (1-2?) 
(1+z 


Use 1) el método de la división directa y 2) el método de MATLAB. 


X(z) = 


Problema B-2-15 
Obtenga la transformada z inversa de 


0.3682? + 0.478z + 0.154 
(z - 1)2* 


mediante el uso del método de la integral de inversión. 


X(2) = 
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Problema B-2-16 
Encuentre la solución de la siguiente ecuación en diferencias: 


x(k + 2) — 1.3x(k + 1) + 0.4x(k) = u(k) 


donde x(0) = x(1) = 0 y x(k) = 0 para k < 0. Para la función de entrada u(k), considere los siguientes dos 
casos: 


E. Es 
uo = (y k<0 


u(0) = 1 
u(k)=0, k#0 


Resuelva este problema tanto de manera analítica como por computadora con MATLAB. 


Problema B-2-17 
Resuelva la siguiente ecuación en diferencias: 
x(k + 2) — x(k + 1) + 0.25x(k) = u(k + 2) 
donde x(0) = 1 y x(1) =2. La función de entrada u(k) está dada por 
u(k) = 1, k=0,1,2,... 
Resuelva este problema tanto de manera analítica como por computadora con MATLAB. 


Problema B-2-18 
Considere la ecuación en diferencias: 


x(k + 2) — 1.3679x(k + 1) + 0.3679x(k) = 0.3679u(k + 1) + 0.2642u(k) 
donde x(k) = 0 para k < 0. La entrada u(k) está dada por 
u(k) = 0, k<0 
u(0) = 1.5820 
u(1) = —0.5820 
u(k) = 0, k= Ios 


Determine la salida x(k). Resuelva este problema tanto de manera analítica como por computadora con 
MATLAB. 
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3 


Análisis en el plano z 
de sistemas de control 
en tiempo discreto 

















3-1 INTRODUCCIÓN 


El método de la transformada z es particularmente útil para analizar y diseñar sistemas de control en 
tiempo discreto, lineales e invariantes en el tiempo, de una entrada y una salida. En este capítulo se 
presenta el material introductorio necesario para el análisis y diseño de sistemas de control en tiempo 
discreto en el plano z. La principal ventaja del método de la transformada z es que ésta habilita al 
ingeniero para aplicar los métodos de diseño convencionales de sistemas en tiempo continuo a siste- 
mas en tiempo discreto que pueden ser en parte en tiempo discreto y en parte en tiempo continuo. 

A lo largo de este libro se supone que la operación de muestreo es uniforme; esto es, sólo existe 
una tasa de muestreo en el sistema y el período de muestreo es constante. Si un sistema de control en 
tiempo discreto incluye dos o más muestreadores en el sistema, se supone que los muestreadores 
están sincronizados y tienen la misma tasa de muestreo o frecuencia de muestreo. 


Organización del capítulo. La organización de este capítulo es la siguiente. En la sección 
3-1 se dan los comentarios introductorios. La sección 3-2 presenta un método para tratar la operación 
de muestreo como una representación matemática de la operación de tomar muestras x(kT) a partir de 
una señal en tiempo continuo x(*) mediante modulación con impulsos. Esta sección incluye el cálculo 
de las funciones de transferencia del retenedor de orden cero y del retenedor de primer orden. 

En la sección 3-3 se trata el método de la integral de convolución para obtener la transforma- 
da z. El tema principal de la sección 3-4 es la reconstrucción de la señal original en tiempo continuo a 
partir de la señal muestreada. Basándose en el hecho de que la transformada de Laplace de la señal 
muestreada es periódica, se presenta el teorema de muestreo. En la sección 3-5 se estudia la función de 
transferencia pulso. También se analiza el modelado matemático de los controladores digitales en 
términos de las funciones de transferencia pulso. La sección 3-6 trata la realización de controladores 
y filtros digitales. 
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EO MEDIANTE IMPULSOS Y RETENCIÓN DE DATOS 


s sitas de control en tiempo discreto pueden operar en parte en tiempo discreto y en parte en 
z ¿¿tíinuo. De esta manera, en dichos sistemas de control algunas señales aparecen como fun- 
¿7 tiempo discreto (a menudo en la forma de una secuencia de números o un código numérico) 
: ¿5%ales como funciones en tiempo continuo. Al analizar sistemas de control en tiempo discre- 
+27:3 de la transformada z juega un papel importante. Para demostrar por qué el método de la 
sitiada z es útil en el análisis de sistemas de control en tiempo discreto, primero se presenta el 


zi: 12 muestreo mediante impulsos y luego se estudia la retención de datos. 





Muestreo mediante impulsos. Se considerará un muestreador ficticio comúnmente llamado 
:=2or mediante impulsos. La salida de este muestreador se considera como un tren de impulsos 
27 za en 1= 0, con el período de muestreo igual a Ty la magnitud de cada impulso igual al valor 
io de la señal en tiempo continuo en el instante de muestreo correspondiente. En la 
-| se muestra un diagrama de un muestreador mediante impulsos. [Se supone que x(t) = 0 para 
> esto que, en forma matemática, un impulso está definido como una función que tiene una 
Ir) 7-2 infinita con duración cero, esto se representa gráficamente mediante una flecha con una am- 
imac <-> representa la magnitud del impulso.) 
-¿ salida muestreada mediante impulsos es una secuencia de impulsos, con la magnitud de cada 
>. >: .zual al valor de x(£) en el instante de tiempo correspondiente. [Esto es, en el tiempo t = AT, el 
>: sxt AT)Ô(C — kT). Observe que 5(1 — kT) =0 a menos que t = kT.] Se empleará la notación x'(£) 
-=7-esentar la salida muestreada mediante impulsos. La señal muestreada x'(£), un tren de impul- 
æ zede representar mediante una sumatoria infinita 








æ 


x*(0) = È x(kT)Slt — kT) 


k=0 
x* (t) = x(0)8(t) + x(T)èlt — T) + -+ x(kD)O( — kT) ++ (3-1) 
Pe 7- 3 un tren de impulsos unitarios como ò, (À, o 


ôr(t) = > S(t — kT) 


3 22 del muestreador es igual al producto de la señal en tiempo continuo de entrada x(£) por el 
z= :mpulsos unitarios 9, (1). En consecuencia, el muestreador se puede considerar como un 
¿207 con la entrada x(£) como la señal moduladora y el tren de impulsos 9, (+) como la portadora, 


> 
emma ss muestra en la figura 3-2. 


2 


ra xt) 


xit) A xn 
3 A aM 


Xs) ör Xx*s) Figura 3-1 Muestreador mediante impulsos. 
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Portadora 









x(t) 
Señal 


l Salida 
moduladora | 
4 


t 
1 
be e 
Figura 3-2 Muestreador mediante impulsos como modulador. 


Después, considere la transformada de Laplace de la ecuación (3-1) 
X* (s) = Hx*(0] = x(0)£[5(0)] + (T)£[8(* — T)] 
+x(2T)£[8(t - 2D)] +- 
= x(0) + x(De "+ 10D) +- 


ES 


= Y) x(kT)e +" (32) 


k=0 
Nótese que si se define 


Ts 


ETT 


Inz 


s=1 
T 


entonces la ecuación (3-2) se convierte en 





X*(s) = S (kT) (3-3) 


s=(1/T) Inz 


El segundo miembro de la ecuación (3-3) es exactamente el mismo que el segundo miembro de la 
ecuación (2-1): es la transformada z de la secuencia x(0), (7), x(2T), . . . , generada a partir de x(1) en t 
= kT, donde k=0, 1,2,.... Por tanto se puede escribir 


X*(s) = X(2) 


s=(1T) inz 


y la ecuación (3-3) se convierte en 


X*(s) 





1 = E 
$=(UT) Inz X* G 1z) = X(z)= 2 x(kT)z* (3-4) 


=0 


Observe que la variable z es una variable compleja y T es el período de muestreo. [Se debe enfatizar 
que la notación X(z) no significa X(s) reemplazando s por z, sino que X'(s = T~ In 2).] 
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Resumen. Se resumirá justamente lo que se acaba de establecer. Si la señal en tiempo continuo 
11) se muestrea mediante impulsos en forma periódica, la señal muestreada se puede representar de 
manera matemática mediante 


x*(1) = Y x(0)8(1 — kT) 
k=0 
En el muestreador mediante impulsos se puede pensar que el interruptor se cierra instantáneamente 
cada período de muestreo 7 y genera impulsos x(A7 )6(+— kT ). Dicho proceso de muestreo se conoce 
como muestreo mediante impulsos. El muestreador mediante impulsos se presenta por conveniencia 
matemática; éste es un muestreador ficticio que no existe en el mundo real. 

La transformada de Laplace de la señal muestreada mediante impulsos x*(+) ha mostrado ser la 
misma que la transformada z de la señal x(/) si e” se define como z, o e” =z. 

Circuitos para la retención de datos. En un muestreador convencional, un interruptor se 
cierra cada período de muestreo T para admitir una señal de entrada. En la práctica, la duración del 
muestreo es muy corta en comparación con la constante de tiempo más significativa de la planta. 
Un muestreador convierte una señal en tiempo continuo en un tren de pulsos que se presenta en 
los instantes de muestreo t = 0, 7, 2T, . . . , donde T es el período de muestreo. (Observe que entre dos 
instantes de muestreo consecutivos el muestreador no transfiere información. Dos señales cuyos res- 
pectivos valores en los instantes de muestreo son iguales darán como resultado la misma señal 
muestreada.) 

La retención de datos es un proceso de generación de una señal en tiempo continuo A(%) a partir 
de una secuencia en tiempo discreto x(AT). Un circuito de retención convierte la señal muestreada en 
una señal en tiempo continuo, que reproduce aproximadamente la señal aplicada al muestreador. La 
señal h(£) durante el intervalo de tiempo ÁT < t < (k + 1) T se puede aproximar mediante un polinomio 
en T como sigue: 


MKT + 7) = aT” +4. 17 1 +--+ aT ta (3-5) 
donde 0 < r < T. Observe que la señal A(AT) debe ser igual ax(AT ), o 
h(kT) = x(kT) 
Por tanto, la ecuación (3-5) se puede escribir como sigue: 
h(kT + 7) = ant" +4. 7" 1 +-+--+a7+x(kT) (3-6) 


Si el circuito de retención de datos es un extrapolador polinomial de n-ésimo orden, se conoce como 
retenedor de n-ésimo orden. De este modo, si n = 1, se denomina retenedor de primer orden. [El re- 
tenedor de n-ésimo orden emplea los n + 1 datos discretos anteriores x((k—mT),x(k-n+DT),..., 
x(kT) para generar una señal AT + 7).] 

Debido a que un retenedor de alto orden utiliza las muestras anteriores para extrapolar una 
señal en tiempo continuo entre el instante de muestreo presente y el siguiente, la exactitud en la 
aproximación de la señal en tiempo continuo se mejora a medida que el número de muestras anterio- 
res utilizadas se incrementa. Sin embargo, esta mejoría en la exactitud se obtiene a costa de un tiempo 
de retraso mayor. En sistemas de control en lazo cerrado, cualquier tiempo de retardo adicional en el 
lazo decrementará la estabilidad del sistema y en algunos casos podría aun causar la inestabilidad del 
mismo. 


El retenedor de datos más sencillo se obtiene cuando n = 0 en la ecuación (3-6), esto es, cuando 
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xit) x(kT) hit) 


t kT 


a o 






Retenedor de 
orden cero 










x(t) Muestreador x(kT) hit) 
Figura 3-3 Muestreador y retenedor de orden cero. 
h(kT + 7) = x(kT) (3-7) 
donde 0 <7 < Ty k=0, 1,2,.... La ecuación (3-7) implica que el circuito retiene la amplitud de la 


muestra de un instante de muestreo al siguiente. Dicho retenedor de datos se conoce como retenedor 
de orden cero, o sujetador, o generador de la señal de escalera. La salida del retenedor de orden cero 
es una función escalonada. En este libro, a menos de que se indique otra cosa, se supone que el 
circuito de retención es de orden cero. 

Se verá posteriormente que la función de transferencia G, del retenedor de orden cero está dada 
mediante 


1-e* 


G, = p 


Retenedor de orden cero. En la figura 3-3 se muestra un muestreador y retenedor de orden 
cero. La señal de entrada x(t) se muestrea en instantes discretos y la señal muestreada se pasa a través 
del retenedor de orden cero. El circuito del retenedor de orden cero suaviza la señal muestreada para 
producir la señal /A(£), la cual es constante desde el último valor muestreado hasta que se puede 
disponer de la siguiente muestra. Esto es, 


h(kT +0) =x(kT), paa0<t<T (3-8) 


Se obtendrá un modelo matemático de la combinación de un muestreador real y de un circuito 
de retención de orden cero, como el que se muestra en la figura 3-4a). A partir del hecho de que la 
integral de una función impulso es una constante, se puede suponer que el retenedor de orden cero es 
un integrador, y la entrada al circuito de retención de orden cero es un tren de impulsos. Entonces un 
modelo matemático para el muestreador real y el retenedor de orden cero se puede construir como se 
muestra en la figura 3-4b), donde G(s) es la función de transferencia del retenedor de orden cero y 
x'(£) es la señal muestreada mediante impulsos de x(£). 


xt) 4 xikT) Retenedor de ht) 
T orden cero 


a) 


x(t x"(t) hat) 
t Grols) 
m's Figura 3-4 a) Muestreador real y retenedor de orden cero; 


x* Has) S 3 
op S g b) modelo matemático que consiste en un muestreador 


diante impulsos y una función de transferencia G(s). 
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Considere el muestreador y el retenedor de orden cero que se muestra en la figura 3-44). Supon- 
za que la señal x(£) es cero para 1 < 0. Entonces la salida »,(£) está relacionada con x(t) como sigue: 


hi(e) = x(0)[L() =- Lt = T) + (DIG - T) — 1 — 2T)) 
+x(2D[1(t 2).=1(=3D0)] += 


æ 


Y ATL — kT) — 1(t — (k + 1)T)] | (3-9) 


k=0 


Puesto que 


e kt 


S 





Lj- kT)] = 


la transformada de Laplace de la ecuación (3-9) se convierte en 


z A DT 
£[h(1)] = His) = 2 AMD) 
Lag -kT 
== 5 x(kT)e™*" (3-10) 
S k=0 


Después, considere el modelo matemático que se muestra en la figura 3-4b). La salida de este 
modelo debe ser la misma que la del retenedor de orden cero real, o 


£[h(0] = As) = Hi(s) 


De este modo, 


æ 


Hs) = eS x(kT)e +" (3-11) 
k=0 
A partir de la figura 3-4b), se tiene 
Hs) = Gro(s)X* (s) (3-12) 


Debido a que 


æ 


X* (s) = © x(kT)]e +” 


k=0 
la ecuación (3-11) se puede escribir como 
1 a a= TS 
HAS) = =—-X05) (3-13) 


Al comparar las ecuaciones (3-12) y (3-13), se ve que la función de transferencia del retenedor de 
orden cero está dada por 


eT 


1- 
di 


Observe que, de forma matemática, el sistema que se muestra en la figura 3-4a) es equivalente al que 
se muestra en la figura 3-4b) desde el punto de vista de la relación entrada-salida. Esto es, un 
muestreador real y retenedor de orden cero se puede reemplazar por un sistema en tiempo continuo 
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matemáticamente equivalente, que consiste de un muestreador mediante impulsos y una función de 
transferencia (1 — ePY/s. Los dos procesos de muestreo se distinguirán (como se aprecia en la figura 
3-4) por la manera en la que se dibujan los interruptores para el muestreo. 


Función de transferencia de un retenedor de primer orden. Aunque los retenedores de pri- 
mer orden no se utilizan en sistemas de control, vale la pena ver cuál podría ser su función de 
transferencia. Se mostrará que la función de transferencia del retenedor de primer orden está dada por 

1-e PTS +1 
Guil(s) = = T 
Ahora se obtendrá la ecuación (3-14). 

Se ha establecido que la ecuación (3-6) describe la salida de un circuito de retención de n-ésimo 

orden. Para el retenedor de primer orden, n = 1. Sustitúyase n = 1 en la ecuación (3-6). Entonces se tiene 


h(kT + 7) = aT + x(kT) (3-15) 





(3-14) 


donde 0 < 7< Ty k=0, 1,2, .... Al aplicar la condición que establece 
h((k — 1)T) = x((k - 1)T) 
la constante a, se puede determinar como sigue: 
h((k ~ 1)T) = —a,T + x(kT) = x((k — 1)T) 


ar 


— AT) — x((k - 1)T) 
_ T 


Por tanto, la ecuación (3-15) se convierte en 
h(kT + 7) = x(kT) + DAM DO, (3-16) 


donde 0 < 7 < T. El proceso de extrapolación del retenedor de primer orden está basado en la ecuación 
(3-16). La señal de salida en tiempo continuo A(£) que se obtiene al utilizar el retenedor de primer orden 
es una señal lineal por secciones, como se muestra en la figura 3-5. 


x(kT) 





0 T 27 3T t -T 0 T 27 3T t 


x(t) S x(kT) 


Figura 3-5 Entrada y salida de un retenedor de primer orden. 
5 El ros.me 








Retenedor de 
primer orden 


2223032 Muestreo mediante impulsos y retención de datos 8. 


Para obtener la función de transferencia del circuito de retención de primer orden, es convenien- 


è suponer una función sencilla para x(£). Por ejemplo, una función escalón unitario, una función 
—pulso unitario o una función rampa unitaria serían buenas elecciones para x(£). 

Suponga que se elige una función escalón unitario como x(z). Entonces, para el muestreador real 
> retenedor de primer orden que se muestra en la figura 3-64), la salida »(+) del retenedor de primer 
zrden consiste en líneas rectas que son extrapolaciones de los dos valores muestreados precedentes 
-a salida A(£) se muestra en el diagrama. La curva de salida A(1) se puede escribir como sigue 


nto =(1+ fio - Exe m1 


_a transformada de Laplace de esta última ecuación es 


H(s) = (++ 1 J) =a Tn PE Ler 


Ts? Ts 
DN Saa e” 1- 
s Ts? 
-Ts L i 1 
= (=e 


(3-17) 


xit) kmg a 


0 T 27 3T t 








-T 0 T 27 3T t 
Retenedor de 


n 4 xiKT) primer orden 


a) 





b) 


Figura 3-6 a) Muestreador real en cascada con un retenedor de primero orden; b) modelo matemático que 
consiste en un muestreador mediante impulsos y G,,(s). 
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En la figura 3-6b) se muestra un modelo matemático del muestreador real en cascada con el retenedor 
de primer orden que se observa en la figura 3-6a). El modelo matemático consiste en un muestreador 
mediante impulsos y G,,(s), la función de transferencia del retenedor de primer orden. La señal de 
salida de este modelo es la misma que la salida del sistema real. Por tanto, la salida H(s) está dada 
también por la ecuación (3-17). 

La transformada de Laplace de la entrada x*(£) al retenedor de primer orden G,(s) es 


1 


X*(s) = 2 UD)" E 


Por tanto, la función de transferencia G,(s) del retenedor de primer orden está dada por 





e H(s) n ES +t1 
Gals) f. X*(s) g a e ) Ts? 
E ( - sa] Ts +1 
_ S T 


Observe que un muestreador real en combinación con un retenedor de primer orden es equivalente a 
un muestreador mediante impulsos con una función de transferencia (1 — e *Y (Ts + 1/07). 

De manera similar, se pueden obtener las funciones de transferencia de retenedores de alto 
orden mediante el procedimiento presentado. Sin embargo, puesto que los circuitos de retención de 
alto orden (n > 2) no son prácticos desde el punto de vista del retraso (el cual puede causar la 
inestabilidad del sistema) y los efectos de ruido, no se obtendrán sus funciones de transferencia. (El 
retenedor de orden cero es el más sencillo y el que se utiliza con mayor frecuencia en la práctica.) 


Resumen. Se resumirá lo que se ha presentado hasta ahora acerca del muestreo mediante 
impulsos. 


1. Un muestreador real toma periódicamente muestras de la señal de entrada y produce una se- 
cuencia de pulsos como salida. Mientras que la duración del muestreo (ancho del pulso) del 
muestreador real es muy pequeña (pero nunca llegará a ser cero), la suposición de que el ancho 
es cero, lo cual implica que la secuencia de pulsos se convierta en una secuencia de impulsos 
cuyas magnitudes son iguales a la señal en tiempo continuo en los instantes de muestreo, 
simplifica el análisis de los sistemas en tiempo discreto. Dicha suposición es válida si la dura- 
ción del muestreo es muy pequeña comparada con la constante de tiempo más significativa del 
sistema y si un circuito de retención se conecta a la salida del muestreador. 


2. Cuando e” se transforma en z, el concepto de muestreo mediante impulsos (el cual es un 
proceso puramente matemático) nos posibilita realizar el análisis de sistemas de control en 
tiempo discreto que involucran muestreadores y circuitos de retención mediante el método de la 
transformada z. Esto significa que mediante el empleo de la variable compleja z se puede aplicar 
de manera directa las técnicas desarrolladas para los métodos de la transformada de Laplace 
para el análisis de sistemas en tiempo discreto que incluyen la operación de muestreo. 


3. Como se puntualizó al principio, una vez que el muestreador real y el retenedor de orden cero se 
han reemplazado de manera matemática por un muestreador mediante impulsos y la función de 
transferencia (1 —e PYs, el sistema se convierte en un sistema en tiempo continuo. Esto simpli- 
fica el análisis de los sistemas de control en tiempo discreto, puesto que se puede aplicar las 
técnicas disponibles para sistemas de control en tiempo continuo. 
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4. Se reitera que el muestreador mediante impulsos es un muestreador ficticio que se introduce 
sólo para propósitos de análisis matemático. No es posible implantar fisicamente tal muestreador 
que genere impulsos. 


CALCULO DE LA TRANSFORMADA Z MEDIANTE EL MÉTODO 
DE LA INTEGRAL DE CONVOLUCIÓN 


E1 esta sección se obtendrá la transformada z de x(t) mediante el método de la integral de convolución. 
Considere el muestreador mediante impulsos que se presenta en la figura 3-7. La salida del 
muestreador mediante impulsos es 


«=D 05 = kT) = x(t) 5 S(t — kT) (3-18) 


k=0 





Si se observan que 
L[8(t — kT)] = e~” 


se tiene 


| 5 ó(t — kr) | =14+e Pe Me PB co _—— 


k=0 


Puesto que 
X*(s) = £[x*(0)] = gO a - £r)| 


se ve que X"(s) es la transformada de Laplace del producto de dos funciones, x(t) y Y Su — kT). 
Observe que esto no es igual al producto de las dos transformadas de Laplace correspondientes. 
La transformada de Laplace del producto de dos funciones f (£) y g (£) se puede dar mediante 


HOO = | FOO di 


1 c+ jo 
=— — pjd 3-19 
amila PCE = p)dp (3-19) 
[Para obtener la ecuación (3-19), véase el problema A-3-4.] 
Sustituyamos f (£) y g (£ por x(t) y ELO (t— KT), respectivamente. Entonces la transformada de 


Laplace de X'(s), donde 


X*(s) = szo 2 ó(t — kr)| 


x(t) > x*(t) 
o n_n 


ôr Figura 3-7 Muestreador mediante impulsos. 
www.FreeLibros.me 


84 Análisis en el plano z de sistemas de control en tiempo discreto Capítulo 3 


puede darse mediante 


X*(s) = gfo y 5(t — En) | 


1 ferjs 


1 
= Inj a ADT AP (3-20) 


donde la integración se hace a lo largo de la línea que corre desde c — j% hasta c + jæ paralela al eje 
imaginario en el plano p y separa los polos de X(p) de los polos de 1/[1 —e"*=”]. La ecuación (3-20) 
es la integral de convolución. Es un hecho bien conocido que dicha integral se puede evaluar en 
términos de los residuos formando un contorno cerrado que consiste en una línea desde c — j% hasta 
c + jæ y un semicírculo de radio infinito en el semiplano izquierdo o derecho, ya que la integral a lo 
largo del semicírculo que se añadió es una constante (ya sea cero o diferente de cero). Esto es, la 
ecuación (3-20) se rescribe como sigue: 


1 fem 1 
X 0) = 37) AD) 
c-ja 


a A o PO sud 
2) 1 ERP pj) 1 e nP En 
donde T'es un semicírculo de radio infinito en el semiplano izquierdo o derecho del plano p. 

Existen dos formas de evaluar esta integral (una es emplear un semicírculo infinito en el semiplano 
izquierdo y la otra es emplear un semicírculo infinito en el semiplano derecho); se describirán los 
resultados que se obtienen para los dos casos por separado. 

En el análisis que se presenta, se supone que los polos de X(s) están en el semiplano izquierdo 
y que X(s) se puede expresar como el cociente de polinomios en s, o 


q(s) 
p(s) 


donde q(s) y p(s) son polinomios en s. También se supone que p(s) es de mayor grado en s que g(s), lo 
cual significa que 


X(s) = => 


lim X(s) = 0 


sor 


Evaluación de la integral de convolución en el semiplano izquierdo. Se evalúa la integral 
de convolución dada por la ecuación (3-21) utilizando un contorno cerrado en el semiplano izquierdo 
del plano p como se muestra en la figura 3-8. Empleando este contorno cerrado, la ecuación (3-21) se 
puede evaluar como sigue: Si observamos que el denominador de X(s) es de mayor grado en s que el 
numerador, la integral a lo largo de T, se desvanece. Por lo tanto, 


e O) 
a ero 


La integral es igual a la suma de los residuos de X ( p) en el contorno cerrado. 


X*9) => [residue of MEAT at pole of xp) (3-22) 
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tm 






plano p 







Polos de 
Xp) 











x 
x 
x 
~ . 
1 Figura 3-8 Contorno cerrado en el 
905.08 Tr semiplano izquierdo del plano p. 
$ 27 1252 al problema A-3-6 para obtener la ecuación (3-22).] Al sustituir e” por z en la ecuación 
Ello se tiene 
l XA(p)z ] 
X(z)=5 j tesiduo de- see en un polo de Xp) | 
2 37 7:arla notación de la variable compleja de p a s, se obtiene 
X ai 
X(2)=2| residuo dem en un polo de X(s) (3-23) 
Suponga que X(s) tiene los polos s, $), . - ., Sm. Si un polo en s = s, es un polo simple, entonces 
= -#7 iuo correspondiente K, es 
, X(s)z 
i K, = lim [6 =a K z] (3-24) 
ssj 
+ voio en s= s, es un polo múltiple de orden »,, entonces el residuo Ķ, es 
1 ana žk mo 
E = ş)" 2 
EN EE imge e (3-25) 
E emplo 3-1 
Dada 
1 
=D 


>btenga X(z) empleando la integral de convolución en el semiplano izquierdo. 
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Observe que X(s) tiene un polo doble en s = 0 y un polo simple en s=—1. Por tanto, la ecuación 
(3-23) se convierte en 





X(s)z 


e Ts 


Xxo=» residuo de en un polo de xo 


z 








1 . d| , 1 z e 1 z 
2- má, s(s+1)z- =l Jim [e 10 +1) 2 - =l 











zj =z[z —- e” + (s + 1)\(-T)e™] 1 z 

T So E+E- ery CI z-e” 

oa) -Z - 2(T-1+e 7)+2(1-e *- Te”) 
(z - 1) ze”? (z - 1}(z - e`") 


_(T-1+e 7) +(1-e7-Te')áz? 
E (G -z` -ez~ . 

Evaluación de la integral de convolución en el semiplano derecho. Ahora se va a evaluar la 
integral de convolución dada por la ecuación (3-21) en el semiplano derecho del plano p. Se elige el 
contorno cerrado que se muestra en la figura 3-9, el cual consiste en una línea desde c — j% hasta c + 
jx« y T';z, la porción de un semicírculo de radio infinito en el semiplano derecho del plano p que está 
situado a la derecha de esta línea. El contorno cerrado encierra a todos los polos de 1/[1 —e**=”], pero 
no encierra a ningún polo de X(p). Ahora X'(s) se puede escribir como 






plano p 


Polos de 
Xip) 





PA 
1- eT" -pì 


Polos de 
Figura 3-9 Contorno cerrado en e! semiplano derecho del plano p. 
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«n 1 E A 
KIENS Irj], E ¿Tn P 
1 X(p) E X(p) 
Pmj) 1-e ERP 2d, 1 e TP dp (3-26) 


En la evaluación de las integrales del segundo miembro de la ecuación (3-26), se necesita 
: >1.siderar dos casos por separado: un caso donde el denominador de X(s) es dos o más grados mayor 
=7 ; que el numerador, y otro caso donde el denominador de X(s) es sólo un grado en s mayor que el 
7 merador. 

Caso 1: X(s) tiene un denominador dos o más grados mayor en s que el numerador. Para este 
350. puesto que X(s) posee por lo menos dos polos más que ceros, se tiene 


limsX(s) = x(0+) =0 


Entonces la integral a lo largo de Ip es cero. De esta manera, en este caso 
ES X(p) 
Y dp=0 
2m/),,1 — e 00. 


+ W(s) se puede obtener como sigue: 
* 1 S ; 
X*(5) =5 2 X( + jwsk) (3-27) 
k=-0 
[Para obtener la ecuación (3-27), véase el problema A-3-7.] Así 


X(2) = DEL Jia (3-28) 


s=(VT) Inz 
Observe que esta expresión de la transformada z es útil para probar el teorema de muestreo (véase la 
sección 3-4). Sin embargo, es muy tedioso obtener expresiones de la transformada z de funciones de 
uso común mediante este método. 

Caso 2: X(s) tiene un denominador un grado mayor en s que el numerador. Para este 
caso, lim sX(s) = x(0+) + 0 < œ y la integral a lo largo de F, no es cero. [El valor distinto de cero está 
asociado con el valor inicial x(0+) de x(1).] Se puede mostrar que la contribución de la integral a lo largo 
de T, en la ecuación (3-26) es EN Esto es, 


x(p) 1 

= —-2x(0+ 
pi A eT I EP ¿0 ) 

Entonces el término integral en el segundo miembro de la ecuación (3-26) se convierte en 


X*(5) =F, E XC + jos k) + 5x(0+) (3-29) 


Ejemplo 3-2 
Muestre que X"(s) es periódica y su período es 27/0w,, 
Refiriéndose a la ecuación (3-29), 


z 1 
X* (s) = T2 X(s + josh) + 5x(0+) 
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Por tanto, 


X*(s + jo,k) = + D X(s + jo,k + josh) + 5x(0+) 


h=-x 


Hagamos que k + h = m. Entonces esta última ecuación se convierte en 


X*(s + jos k) = + L X(s + jwsm) + 5x(0+) = = X*(s) 


Por tanto, se tiene 
X* (s) = X*(s + jo,k), k=0,1,2,... 


De esta manera, X’ (s) es periódica, con período 271/w,. Esto significa que, si la función X(s) tiene un polo 

en s = s en el plano s, entonces X (s) tiene polos en s =s, +jæ,k (k=0, 1,2,...). 

Cálculo de la transformada z de funciones que involucran el término (1 -— e™)/s. Se consi- 
derará aquí que en la función X(s) se incluye (1 — e™™)/s. Suponga que la función de transferencia G(s) 
sigue de un retenedor de orden cero. Entonces el producto de la función de transferencia del retenedor 
de orden cero y G(s) se convierte en 


X(s) = te 


En los siguientes pasos se obtendrá la transformada z de dicha función X(s). 
Observe que X(s) se puede escribir como sigue: 


xo) = 1-28 = qa ~ emas) 6-30) 
donde 
G(s) = cn 
Considere la función 
X¡(s) = e G(s) (3-31) 


Puesto que X(s) es el producto de la transformada de Laplace de dos funciones, la transformada : 
inversa de Laplace de la ecuación (3-31) puede estar dada mediante la siguiente integral de convolución: ; 


xo) = | golt- Dedo dr 
donde 

golt) = Ee] = êt — T) 

g(t) = LG, (s)] 


x(t) = [50 — T - Deir) d7 


= g(t — T) 
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i 


= 7 tanto, si escribimos 

Z [g1(1)] = Grlz) 
= transformada z de x,(£) resulta ser 

Z[x(0)] = Z[g1(1 - T)] = 2 Gi(2) 
- 7. referencia a las ecuaciones (3-30) y (3-31), se tiene 
X(2) = Z[Gí(s) - e`” Gs) 

=2 [80] - 2x0] 

= Gi(2)=2* Gi(2) 

= (1- 2G1(2) 


E G(s 
X(2) = Z[X(5)] = (1 — 297 (20 El (3-32) 
De este modo se ha mostrado que si X(s) incluye un factor (1 —e7”*), entonces, al obtener la transfor- 
mada z de X(s), el término 1 — e” = 1 2” se puede factorizar de modo que X(z) sea igual al producto 
ze (1 —72")) y la transformada z del término remanente. 
De manera similar, si la función de transferencia G(s) sigue de un retenedor de primer orden 
(5), donde 





les y TS 


Gmls) = s T 


entonces la transformada z de la función 


1-e Y Ts +1 
E O 


xo) 
se puede obtener como sigue, Puesto que 
X6) = 0 -ery Lag) 


mediante el mismo enfoque que se utilizó para obtener la ecuación (3-32), se tiene 


m 





X(2) = zla- ery c) 


tl 





= (1-2 YZ 257 (| (3-33) 


La ecuación (3-33) se puede emplear para obtener la transformada z de la función que incluye el 
circuito retenedor de primer orden. 


Ejemplo 3-3 
Obtenga la transformada z de 
E e” 1 
s s+1 
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Con referencia a la ecuación (3-32), se tiene 


[=e 1 Ss 
X(2)=2 na 


Da > + 5 
=(1- anzi- Ll 


ai ren aem 
oqs AE 


l-e?z" 





3-4 RECONSTRUCCIÓN DE SEÑALES ORIGINALES A PARTIR 
DE SEÑALES MUESTREADAS 


Teorema del muestreo. Si la frecuencia de muestreo es suficientemente alta, comparada con la 
componente de más alta frecuencia que se incluye en la señal en tiempo continuo, las caracteristicas 
de amplitud de la señal en tiempo continuo se pueden preservar en la envolvente de la señal muestreada. 

Para reconstruir la señal original a partir de una señal muestreada, existe una frecuencia mínima 
que la operación de muestreo debe satisfacer. Dicha frecuencia mínima se especifica en el teorema de 
muestreo. Se supondrá que la señal en tiempo continuo x(f) tiene un espectro en frecuencia como el 
que se muestra en la figura 3-10. Esta señal x(£) no contiene ninguna componente de frecuencia arriba 
de w, radianes por segundo. 


Teorema del muestreo. Si w,, definida como 271,/T, donde T es el período de muestreo, es 
mayor que 2w, O 


Ww; > 2w 


donde w, es la componente de más alta frecuencia presente en la señal en tiempo continuo x(t), 
entonces la señal x(t) se puede reconstruir completamente a partir de la señal muestreada x*(t). 

El teorema implica que si w, > 2, entonces, a partir del conocimiento de la señal muestreada, es 
teóricamente posible reconstruir con exactitud la señal en tiempo continuo original. A continuación, 
se hará uso de un enfoque gráfico intuitivo para explicar el teorema del muestreo. Para un enfoque 
analítico, véase el problema A-3-10. 

Para mostrar la validez del teorema del muestreo, se necesita encontrar el espectro en frecuencia 


| Xu)! 


-w 0 W w Figura 3-10 Un espectro en frecuencia. 
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z =: señal muestreada x*(+). La transformada de Laplace de x*(£) se obtuvo en la sección 3-3 y está 
2222 por las ecuaciones (3-27) o (3-29), dependiendo de que x(0+)= 0 o no. Para obtener el espectro 
+7 Tecuencia, se sustituye jæ por s en la ecuación (3-27). [En el estudio del espectro en frecuencia, no 
æ —2cesita estar interesado en el valor de x(0+).] De este modo, 


A E A 
X*(jo)=7 2 X(jo + jøsk) 


=. + TXU% — 0,)) + +X(jo) + +XGlo +w) (3-34) 


z <cuación (3-34) da el espectro en frecuencia de la señal muestreada x*(1). Se observa que el espectro 
¿7 Trecuencia de una señal muestreada mediante impulsos se reproduce un número infinito de veces 
+ se atenúa en un factor de 1/7. De esta manera, el proeeso de modulación mediante impulsos de una 
señal en tiempo continuo produce una serie de bandas laterales. Puesto que X (s) es periódica con un 
zeriodo 277/w,, como se muestra en el ejemplo 3-2, o 


X*(s) = X*(s + jok)  k=0,1,2,... 


si una función X(s) tiene un polo en s = s,, entonces X*(s) tiene un polo ens =s, +jwk(k=0,1,2,...). 
En las figuras 3-11a) y b) se muestran las gráficas del espectro en frecuencia X’ (jw) contra w para 


I X* (jw 





b) 


Figura 3-11 Gráficas de espectros en frecuencia de |Y( jw)| contra w para dos valores de frecuencia de muestreo 
w.: a) w, > 2w; b) w, < 2w. 
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dos valores de la frecuencia de muestreo w,. La figura 3-11a) corresponde a w, > 2w,, mientras que la 
figura 3-116) corresponde a w, <2%w,. Cada una de las gráficas de X (jæ)| contra œw consiste en |X(w)/ 
T repetido cada w, = 271/T rad/s. En el espectro en frecuencia de |X(¡w)| la componente |X(¡w)|/T se 
denomina componente primaria, y las otras componentes |X(¡(w + w K))/T se denominan compo- 
nentes complementarias. 

Si w, <20w,, las componentes de |X"(¡w)| no se traslaparán, y el espectro en frecuencia muestreado 
se repetirá cada w, rad/s. 

Si w, <2}, la forma original de |X(¡w»)| no aparece más en la gráfica de |Y"(¡w)| contra w debido 
a la superposición de los espectros. Por lo tanto, se ve que la señal en tiempo continuo x(/) se puede 
reconstruir a partir de la señal muestreada mediante impulsos x'(£) a través de filtrado si y sólo si «w, > 
20. 

Se debe observar que aunque el requisito de la frecuencia de muestreo mínima se especifica en 
el teorema del muestreo como w, > 2w,, donde w, es la componente de más alta frecuencia presente en 
la señal, algunas consideraciones prácticas sobre la estabilidad del sistema en lazo cerrado y otras 
consideraciones de diseño pueden hacer necesario muestrear a una frecuencia mucho más alta que 
este valor mínimo teórico. (Con frecuencia, w, se elige como 10w, 0 20w,.) 


Filtro paso-bajas ideal. La amplitud del espectro en frecuencia de un filtro paso-bajas ideal 
G,( ju) se muestra en la figura 3-12. La magnitud del filtro ideal es unitaria sobre el intervalo de 
frecuencias —7w, < w S +4, y es cero fuera de este intervalo de frecuencias. 

El proceso de muestreo introduce un número infinito de componentes complementarias (com- 
ponentes de bandas laterales) además de la componente primaria. El filtro ideal atenuará todas las 
componentes complementarias hasta cero y permitirá sólo el paso de la componente primaria, siempre 
que la œ, sea dos veces mayor que la componente de más alta frecuencia de la señal en tiempo 
continuo. Dicho filtro ideal reconstruye la señal en tiempo continuo representada por las muestras. En 
la figura 3-13 se muestran los espectros en frecuencia de las señales antes y después del filtrado ideal. 

El espectro en frecuencia a la salida del filtro ideal es 1/7 veces el espectro en frecuencia de la 
señal en tiempo continuo original x(£). Debido a que el filtro ideal tiene características de magnitud 
constante para la región de frecuencias -+ w, S œ < +w, no hay distorsión en ninguna frecuencia 
dentro de este intervalo. Esto es, no hay corrimiento de fase en el espectro de frecuencia de un filtro 
ideal. (El corrimiento de fase del filtro ideal es cero.) 

Se debe observar que si la frecuencia de muestreo es menor que el doble de la componente de 
mayor frecuencia de la señal en tiempo continuo original, entonces, debido a que los espectros en 


| Gij) | 


w Figura 3-12 Espectro de frecuencia en amplitud de un filtro paso- 
bajas ideal. 


n|,£ 
nj E 


www.FreeLibros.me 


122225 3-4 Reconstrucción de señales originales a partir de señales muestreadas 93 


XI jw) | LX fu) | 1Y (ja) | 
EA 
T 


-w 0 AA O 20, 00, 











Filtro ideal 


— | 87 Gil jw) 


F:zura 3-13 Espectro en frecuencia de las señales antes y después del filtrado ideal. 


Tecuencia de la componente primaria y complementarias se traslapan, aun el filtro ideal no puede 
zconstruir la señal original en tiempo continuo. (En la práctica, el espectro en frecuencia de la señal en 
.empo continuo en un sistema de control se puede extender más allá de ++ w, incluso cuando las 
amplitudes a altas frecuencias son pequeñas.) 


El filtro paso-bajas ideal no es fisicamente realizable. Se encontrará la respuesta impulso 
cel filtro ideal. Se mostrará que para el filtro ideal se requiere una salida antes de que se aplique la 
zntrada al filtro. Así, éste no es fisicamente realizable. 

Debido a que el espectro en frecuencia del filtro ideal está dado por 


1 -loyo =0=<1lw 
G TA E , DS LS: 
(j ) 0, en otro caso 


«a transformada inversa de Fourier del espectro en frecuencia da como resultado 


1 f” PF 
g(t) = =f G(jæ)e” dw 


1 o2 
= — e” dw 
27 — 0,12 


a 1 s (eies: p e~ Diosr) 


— 2rjt 


1 sen (w, t/2) 
gt) = T oti (3-35) 


La ecuación (3-35) da la respuesta impulso unitario del filtro ideal. En la figura 3-14 se muestra una 
gráfica de g,(t) contra t. Nótese que la respuesta se extiende desde £ = —% hasta ż = %. Esto implica que 
existe respuesta para £ < 0 a un impulso unitario que se aplica en £= 0. (Es decir, la respuesta en el tiem- 
po empieza antes de que se aplique la entrada.) Esto no puede ser cierto en el mundo físico. Por lo tan- 
to, dicho filtro no es físicamente realizable. [Sin embargo en muchos sistemas de comunicaciones, es 
posible aproximar g(£) mediante la adición de un atraso de fase, lo cual significa agregar un retraso 
al filtro. En sistemas de control realimentado, incrementar el atraso de fase no es deseable desde el 
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Figura 3-14 Respuesta al impulso g(t) de un filtro ideal. 


puno de vista de la estabilidad. Por lo tanto, se evita agregar atrasos de fase para aproximar al filtro 
ideal.] ki 

Puesto que el filtro ideal es irrealizable y debido a que las señales en sistemas de control 
prácticos, en general tienen componentes de alta frecuencia que no están limitados en banda de 
manera ideal, esto no es posible, en la práctica, para reconstruir con exactitud la señal en tiempo 
continuo a partir de la señal muestreada, no importa qué frecuencia de muestreo se elija. (En otras 
palabras, desde el punto de vista práctico, no es posible reconstruir con precisión la señal en tiempo 
continuo en un sistema de control práctico una vez que éste se ha muestreado.) 


Características de respuesta en frecuencia de un retenedor de orden cero. La función de 
transferencia de un retenedor de orden cero es 


er 


1 ex 
Gro(s) = PE (3-36) 
Para comparar al retenedor de orden cero con el filtro ideal, se obtendrán las caracteristicas de res- 
puesta en frecuencia de la función de transferencia del retenedor de orden cero. Mediante la sustitu- 


ción de jæ por s en la ecuación (3-36), se obtiene 


2. 1-e 7 
Girl jo) = jo 

22 UTA ¿ADT EM e” DT 

y 2jw 

_psen(oT/2) agne 

Su 

La amplitud del espectro en frecuencia de Gw (jæ) es 
oa [sen(wT/2) 
IGrolje)| = T| 7 (3-37) 





La magnitud se hace cero en la frecuencia igual a la frecuencia de muestreo y en múltiplos enteros de 
la frecuencia de muestreo. 

En la figura 3-15a) se muestran las características de respuesta en frecuencia del retenedor de 
orden cero. Como se puede observar a partir de la figura 3-15, existe un pico de ganancia no deseado 
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¿7 is trecuencias de 3w/2, 5w,/2, etcétera. Nótese que la magnitud es más de 3 dB abajo de (0.637 = 
+ -2 -I JB) en la frecuencia + ,. Debido a que la magnitud decrece en forma gradual a medida que la 
t= —=_encla se incrementa, las componentes complementarias se atenúan gradualmente hasta cero. 
O F aso que las características de magnitud del retenedor de orden cero no son constantes, si el 
: zama está conectado a un muestreador y retenedor de orden cero, se presenta distorsión en el 
s:TEctro en frecuencia del sistema. 
Las características de corrimiento de fase del retenedor de orden cero se pueden obtener como 
: ¿..2. Observe que sen (w7/2) adopta valores positivos y negativos a medida que w se incrementa de 
¿2 .de w, 220, de 2%, a 3w, y así sucesivamente. De este modo, la curva de fase [parte inferior de 
¿ 7 zura 3-15a)] es discontinua en w = kw, = 211k/T, donde k = 1, 2, 3, . . . . Dicha discontinuidad o 
¿mbio de un valor positivo a uno negativo, o viceversa, se puede considerar como un corrimiento de 
“255 de = 180". En la figura 3-15a), se supone que el corrimiento de fase es de —1 80°. (Se puede suponer 


137 bién que es de +1807. ) De esta manera, 


se TZ) an 
¿a E 


wT ; wT oT 
= havia =(1/2)oT — O E a, 
/ sen > +/8 sen > 3 
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Figura 3-15 a) Curvas de respuesta en frecuencia para el retenedor de orden cero; b) diagrama de Bode 
equivalente cuando T = 1 s. 
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donde 
oT 
2 


CA 2 


fn =e o +180° 


En la figura 3-15b) se presenta una modificación de cómo presentar las características de res- 
puesta en frecuencia del diagrama de la figura 3-1 5a). El diagrama que se muestra en la figura 3-15b) es 
el diagrama de Bode del retenedor de orden cero. Se supone que el período T de muestreo es de 1 so 
T= 1. Nótese que la curva de magnitud tiende a —o decibeles en puntos de frecuencia que son 
múltiplos enteros de la frecuencia de muestreo w, = 27/T = 6.28 rad/s. Las discontinuidades de la 
curva de fase [parte inferior de la figura 3-156)] se presentan en estos puntos de frecuencia. 

Para resumir lo que se ha establecido, el espectro en frecuencia de la salida del retenedor de 
orden cero incluye las componentes complementarias, debido a qué las características de magnitud 
muestran que la magnitud de G,( jœ) es distinta de cero para |w| > 7 w, excepto en los puntos donde 
w=t0, 0=+20w, 0=+30w,,.... En la curva de fase existen discontinuidades de +180* en los puntos 
de frecuencia múltiplos de w, Excepto por estas discontinuidades en la fase, ésta es lineal en w. 

En la figura 3-16 se muestra la comparación del filtro ideal y el retenedor de orden cero. Con 
propósitos de comparación, las magnitudes |G( jw)| están normalizadas. Se observa que el retenedor 
de orden cero es un filtro paso-bajas, aunque su función no es muy buena. A menudo, el filtrado 
adicional de la señal en bajas frecuencias antes del muestreo es necesario para remover de manera 
efectiva las componentes de frecuencia mayores que + w,. 

La exactitud del retenedor de orden cero como un extrapolador depende de la frecuencia de 
muestreo «,. Esto es, la salida del retenedor se puede hacer tan cercana a la señal en tiempo continuo 
original como sea posible haciendo que el período de muestreo T sea tan pequeño como la situación 
práctica lo permita. 


Doblamiento. El fenómeno de traslape en el espectro en frecuencia se conoce como 


doblamiento. En la figura 3-17 se muestran las regiones donde se presenta error de doblamiento. La 
frecuencia + œ, se denomina frecuencia de doblamiento o frecuencia de Nyquist wy. Esto es, 


| Gl ju) | 







Filtro ideal 


Retenedor de orden cero 


ws -20w, TOs 


Figura 3-16 Comparación del filtro ideal y el retenedor de orden cero. 
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124(ja) | 


Error de 
doblamiento 


Figura 3-17 Diagrama que muestra 





=w, W, 0 w, Ws w las regiones donde se presentan los 
2 2 errores de doblamiento, 
1 T 
Un = 70 = 7, 
DE 


Zn la práctica, las señales en los sistemas de control tienen componentes de alta frecuencia, y casi 
s:=mpre existe algún efecto de doblamiento. Por ejemplo, en un sistema electromecánico alguna señal 
cuede estar contaminada por ruido. El espectro en frecuencia de la señal, por tanto, puede incluir 
omponentes de baja frecuencia, así como componentes de ruido de alta frecuencia (esto es, ruidos en 
59 o 400 Hz). Debido a que las frecuencias de muestreo mayores de 400 Hz no son prácticas, la alta 
Trecuencia se doblará y aparecerá como una baja frecuencia. Recuerde que todas las señales con fre- 
cuencias mayores a + w, aparecen como señales de frecuencias entre 0 y + w,. De hecho, en ciertos 
vasos, una señal de frecuencia cero puede aparecer en la salida. 


Traslape. En el espectro en frecuencia de una señal muestreada mediante impulsos x*(0), 
donde w, <2w,, como el mostrado en la figura 3-18, considere un punto de frecuencia arbitrario œw, que 
cae en la región del traslape del espectro en frecuencia. El espectro en frecuencia en w = w, incluye 
dos componentes |X(jw»)| y X Ulo,- œJ). La última componente viene del espectro en frecuencia 
centrado en w= w,. De este modo, el espectro en frecuencia de la señal muestreada en w= w, incluye 


L X* twl 


120 lo, — w2) 











-2w =w, T 0 wa ww 24, w 
Figura 3-18 Espectro en frecuencia de una señal muestreada mediante impulsos x*(/). 
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componentes no sólo en la frecuencia œw, sino también en la frecuencia w, — œ, (en general, en nw, + 
œw, donde z es un entero). Cuando el espectro compuesto se filtra mediante un filtro paso-bajas, tal 
como un retenedor de orden cero, algunas armónicas de alta frecuencia estarán aún presentes en la 
salida. La componente de frecuencia en w = nw, + œw, (donde n es un entero) aparecerá en la salida 
como si ésta fuera una componente de frecuencia en w = w,. No es posible distinguir el espectro en 
frecuencia en w = œ, de aquel en w = nw, + œ. 

Como se muestra en la figura 3-18, el fenómeno de que la componente de frecuencia w, ~ w, (en 
general, nw, + œ, donde n es un entero) se presente sobre la frecuencia w, cuando la señal x(1) se 
muestrea se denomina traslape. Esta frecuencia w, — œw, (en general, nw, + œ) se conoce como un 
alias de w,. 

Es importante recordar que las señales muestreadas son idénticas si las dos frecuencias difieren 
por un múltiplo entero de la frecuencia de muestreo w,. Si una señal se muestrea a una frecuencia baja 
de modo que el teorema de muestreo no se satisfaga, entonces las altas frecuencias se “doblan hacia 
adentro” y aparecen como bajas frecuencias. = 

Para evitar el traslape, se debe ya sea elegir la frecuencia de muestreo lo suficientemente alta (w, 
> 2w,, donde w es la componente de más alta frecuencia presente en la señal) o utilizar un prefiltro 
antes del muestreador para darle forma al espectro en frecuencia de la señal (de modo que el espectro 
en frecuencia para w > + w, sea despreciable) antes de que la señal sea muestreada. 


Oscilaciones escondidas. Se debe observar que, si la señal en tiempo continuo x(£) incluye 
una componente de frecuencia igual a n veces la frecuencia de muestreo w, (donde n es un entero), 
entonces la componente puede no aparecer en la señal muestreada. Por ejemplo, si la señal 


x(t) = x(t) + x(t) =sent + sen3t 


donde x,(1) = sen £ y x(t) = sen 3f, se muestrea en 1= 0, 277/3, 477/3, . . . (la frecuencia de muestreo w, 
es 3 rad/s), entonces la señal muestreada no mostrará la componente de frecuencia con w = 3 rad/s, la 
frecuencia es igual a w, (Véase la figura 3-19.) 

Aun cuando la señal x(t) incluya una oscilación con w = 3 rad/s [esto es, la componente x,(t) = 
sen 31], la señal muestreada no muestra esta oscilación. Dicha oscilación existente en x(t) entre los 
períodos de muestreo se denomina oscilación escondida. 


3-5 LA FUNCIÓN DE TRANSFERENCIA PULSO 


La función de transferencia para un sistema continuo relaciona las transformadas de Laplace de la sa- 
lida en tiempo continuo con la correspondiente de la entrada en tiempo continuo, mientras que la 
función de transferencia pulso relaciona las transformadas z de la salida en los instantes de muestreo 
con la correspondiente entrada muestreada. 

Antes de estudiar la función de transferencia pulso, es conveniente estudiar la sumatoria de 
convolución. 


Sumatoria de convolución. Considere la respuesta de un sistema en tiempo continuo excita- 
do por una señal muestreada mediante impulsos (un tren de impulsos) como se muestra en la figura 
3-20. Suponga que x(£) = 0 para £ < 0. La señal muestreada mediante impulsos x*(£) es la entrada al 
sistema en tiempo continuo cuya función de transferencia es G(s). Se supone que la salida del sistema 
es una señal en tiempo continuo y(£). Si en la salida hay otro muestreador, sincronizado en fase con el 
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Zr sent 
0 
T 27 3r dr t 
x(t) sen 3t 
0 
n 27 37 Ar t 
x(t) sen t+ sen 3t 


xik} 





Figura 3-19 Gráficas de x,(/) = sen 7, x,(f) = sen 37, y x(f) = sen £ + sen 37. 
Señal muestreada x(k), donde la frecuencia de muestreo w, = 3 rad/s, no muestra 
oscilación con la frecuencia w = 3 rad/s. 


muestreador de la entrada, y ambos operan con el mismo periodo de muestreo, entonces la salida es un 


tren de impulsos. Se supone que y(1) = 0 para t < 0. 
La transformada z de y(r) es 


Zly(0] = Y(z) = 2 y(kT)2* (3-38) 





$, 


Figura 3-20 Sistema de tiempo continuo G(s) excitado con una señal muestreada 
mediante impulsos. 
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En ausencia del muestreador a la salida, si se considera un muestreador ficticio en la salida (sincronizado 
en fase con el muestreador de entrada y opera al mismo período de muestreo) y se observa la secuen- 
cia de valores que toma y(2) sólo en los instantes £ = ÁT, entonces la transformada z de la salida y*(1) 
puede también estar dada por la ecuación (3-38). 

Para el sistema en tiempo continuo, es bien conocido el hecho de que la salida del sistema y(t) 
está relacionada con la entrada x(£) por medio de la integral de convolución, o 


y(0) = ES dd xo eds 


donde g(1) es la función de ponderación del sistema o la función de respuesta impulso del sistema. 
Para sistemas en tiempo discreto se tiene una sumatoria de-cenvolución, similar a la integral de 
convolución. Debido a que 


x x 


x*(t) = È x()8(t — kT) = Y x(k«T)6(0 — kT) 


k=0 k=0 


es un tren de impulsos, la respuesta y(t) del sistema debida a la entrada x*(1) es la suma de las 
respuestas impulso individuales. Por tanto, 


8(1)x(0), 0st<T 
g(t)x(0) + g(t - TD), T<t<2T 
y(t) = 1 8(0x(0) + g(t — TXT) + g(t - 2T)x(2T), 2T <1t<3T 


g(t)x(0) + g(t- DAT) +--+ g(t- kT)x(kT), kTst<(k+1)T 


Si observamos que para un sistema fisico una respuesta no puede preceder a la entrada, tenemos que 
g(t) = 0 para £ < 0 o g(t — kT) = 0 para t < kT. En consecuencia, las ecuaciones anteriores se pueden 
combinar en una sola ecuación: 


y(t) = 2(0x(0) + g(t — T)x(T) + g(t —- 2T)x(2T) + --> + g(t — kT)x(kT) 
= Sa — ATI(AT) 0O<t<kT 


Los valores de la salida y(£) en los instantes de muestreo t = kT(k=0, 1, 2, . . .) están dados por 


y(kT) = 


1 >~ 


g(kT — hT)x(hT) (3-39) 


h 


Es 


i 


= È x(kT - hT)g(hT) (3-40) 


h 


donde g(AT) es la secuencia de ponderación del sistema. [La transformada z inversa de G(z) se 
denomina secuencia de ponderación.] La sumatoria en las ecuaciones (3-39) o (3-40) se conoce como 
sumatoria de convolución. Observe que la notación simplificada 


y (KT) = x(KT) + g(KT) 
se emplea a menudo para la sumatoria de convolución. 
Debido a que se supuso que x(£) = 0 para 1 < 0, se tiene que (47 —hAT)=0 para h > k. También. 
debido a que g(kT — hT )= 0 para h > k, se puede suponer que los valores de A en las ecuaciones 
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3-39) y (3-40) se pueden tomar desde O hasta œ más que desde 0 hasta k sin alterar el valor de la 
:-matoria. Por tanto, las ecuaciones (3-39) y (3-40) se pueden rescribir como sigue: 


y(kT) = y g(kT — hT)x(HT) (3-41) 
= Y x(eT — hT)E (HT) (3-42) 


Se debe observar que si G(s) es un cociente de polinomios en s y si el grado del polinomio 
lei denominador excede sólo en 1 el grado del polinomio del denominador, la salida y(f) es 
-:scontinua, como se muestra en la figura 3-21a). Cuando 48 es discontinua, las ecuaciones 
3-41) y (3-42) darán los valores inmediatamente posteriores a los instantes de muestreo, esto es 
CIDH), ..., Y(KT+). Dichos valores no describen la curva real de la respuesta. 

Sin embargo, si el grado del polinomio del denominador excede al del numerador en 2 o 
—as. la salida y(1) es continua, como se muestra en la figura 3-21b). Cuando y(£) es continua, las 
zcuaciones (3-41) y (3-42) darán los valores en los instantes de muestreo. Los valores de y(A) en 
zicho caso describen los valores de la curva real de la respuesta. 


o 
x 
N 
Y 
1 
y 
A 
x 
a 
N 
~ 


rt) 


Figura 3-21 a) Gráfica de la salida 31(1) (respuesta al 
T 27 3T AT 57 t impulso) contra ż cuando el grado del polinomio del 
denominador de G(s) es de grado mayor en | que el polinomio 
del numerador; b) gráfica de la salida y(1) contra ? cuando el 
grado del polinomio del denominador de G(s) es de grado 
b) mayor en 2 o más que el polinomio del numerador. 


o 
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Al analizar los sistemas de control en tiempo discreto es importante recordar que la respuesta 
del sistema a una señal muestreada mediante impulsos puede no describir el correcto comporta- 
miento de la respuesta en el tiempo para el sistema real, a menos que la función de transferencia G(s) 
de la parte del sistema en tiempo continuo tenga por lo menos dos polos más que ceros, de modo que 
lim sG(s)=0. 


$00 


Función de transferencia pulso. A partir de la ecuación (3-41) se tiene 
Y(kT) = Ð g(kT — hT)x(hT), —k=0,1,2... 
h=0 
donde g (kT — hT) = 0 para h > k. Por lo tanto, la transformada z de y(kT) se convierte en 


Y(z) = , y(kT)z* Dad 


E (KT — ATyx(hT)z™* 


I 


Il 
8 ¿Ms ¿Ms IM» 


e¿mDx(hT)z "h 


5 g(mT)z"" y x(AT)z"* 


G(2)X(2) (3-43) 
donde m=k-—hy 
G(z) = © g(mT)z " = transformada z de g (1) 
m=0 


La ecuación (3-43) relaciona la salida pulso Y(z) del sistema y la entrada pulso X(z). Esto propor- 
ciona un medio para determinar la transformada z de la secuencia de salida para cualquier secuencia de 
entrada. Al dividir ambos miembros de la ecuación (3-43) entre X(z) obtenemos 


Y(2) 


ci) = Zi) 





(3-44) 


La G(z} dada por la ecuación (3-44), el cociente entre la salida Y(z) y la entrada X(z), se denomina 
función de transferencia pulso del sistema en tiempo discreto. Ésta es la transformada z de la secuen- 
cia de ponderación. En la figura 3-22 se muestra un diagrama de bloques para una función de transfe- 
rencia pulso G(z), junto con la entrada X(z) y la salida Y(z). Como se ve de la ecuación (3-43), la 
transformada z de la señal de salida se puede obtener como el producto de la función de transferencia 
pulso del sistema y la transformada z de la señal de entrada. 

Observe que G(z) es también la transformada z de la respuesta del sistema a la entrada delta de 
Kronecker: 


X ' A 
a Giz) na Figura 3-22 Diagrama de bloques para la función de 
transferencia pulso de un sistema. 


www.FreeLibros.me 





cs22ón 3-5 La función de transferencia pulso 103 


1, k=0 
OS ET) = 0 A +0 


oido a que la transformada z de la entrada delta de Kronecker es 


æ 


X(z)= X Mine 


k=0 


¿7:onces, refiriéndose a la ecuación (3-44), la respuesta Y(z) a la entrada delta de Kronecker es 


Y(z) = G(z) 


De este modo, la respuesta del sistema a la entrada delta de Kronecker es G(z), la transformada z de la 
secuencia de ponderación. Este hecho es paralelo al de que G(s) es ta transformada de Laplace de 
2 función de ponderación del sistema, que es la respuesta del sistema a la función impulso unitario. 


Transformada de Laplace asterisco de la señal que involucra tanto transformadas de Laplace 
ordinarias como asterisco. Al analizar los sistemas de control en tiempo discreto, a menudo se 
3" cuentra que algunas señales en el sistema son señales asterisco (lo que significa que las señales 
astan muestreadas mediante impulsos) y otras no lo son. Para obtener las funciones de transferencia 
zulso y analizar el sistema de control en tiempo discreto, por lo tanto, se debe ser capaz de obtener las 
ransformadas de las señales de salida de los sistemas que contienen operaciones de muestreo en 
varios lugares en los lazos. 

Suponga que el muestreador mediante impulsos es seguido por un elemento lineal en tiempo 
continuo, cuya función de transferencia es G(s), como se muestra en la figura 3-23. En el siguiente 
análisis se supone que todas las condiciones iniciales en el sistema son cero. Entonces, la salida Y(s) es 


Y(s) = G(s)X*(s) (3-45) 


Notese que Y(s) es el producto de X"(s), que es periódica con un período de 277/w,, y G(s), no periódica. 
El hecho de que las señales muestreadas mediante impulsos son periódicas se puede ver del hecho de 
que 


X* (s) = X*(s + jo,k), k=0,1,2,... (3-46) 
«Véase el ejemplo 3-2.) 


En lo que se presenta a continuación se mostrará que al tomar la transformada de Laplace 
asterisco de la ecuación (3-45) se puede factorizar X’ (s) de manera que 


Y* (s) = [G(s)X*(s)]* = [G(s)1*X*(5) = G*(s)X* (s) (3-47) 


Este hecho es muy importante en la obtención de la función de transferencia pulso y también en la 
simplificación del diagrama de bloques del sistema de control en tiempo discreto. 
Para obtener la ecuación (3-47), observe que la transformada inversa de Laplace de Y(s) dada por 
z ecuación (3-45) se puede escribir como sigue: 


xit) Y x* 12) yit) Figura 3-23 Sistema muestreado 


Xis) 87 X*(s) Y(s) mediante impulsos. 
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y(1) = £”[G(s)X*(s)] 


= ES — Tx*(r)dr 

5 f FEF EOG = kT)d? 

= y Fs — ma(rjó(r — kT) dr 
k=0 70 


= Y g(t — kT)x(kT) 
k=0 
Entonces la transformada z de y(f) se convierte en 


Y(2) = 2 [y] = E ES g(nT — kr px) |z- 


n=0 Lk=0 


Us 


> g(mT)x(kT)z 20" 


0k=0 


m 


donde m = n — k. De este modo, 


x 


Y(z) = > g(mT)z"" 2 x(kT)z* 
= G(2)X(2) (3-48) 


Debido a que la transformada z puede entenderse como la transformada de Laplace asterisco con e” 
reemplazada por z, la transformada z se puede considerar una notación corta para la transformada de 
Laplace asterisco. De esta manera, la ecuación (3-48) se puede expresar como 


Y*(s) = G*(s)X*(s) 


que es la ecuación (3-47). Así se ha mostrado que al tomar la transformada de Laplace asterisco en 
ambos miembros de la ecuación (3-45) se obtiene la ecuación (3-47). 

Para resumir lo que se ha obtenido, observe que las ecuaciones (3-45) y (3-47) establecen que al 
tomar la transformada de Laplace asterisco de un producto de transformadas, donde algunas son 
transformadas de Laplace ordinarias y otras son transformadas de Laplace asterisco, las funciones 
que ya están en transformadas asterisco se pueden factorizar de la operación de la transformada de 
Laplace asterisco. 

Se debe observar que los sistemas se hacen periódicos bajo la operación de la transformada de 
Laplace asterisco. Dichos sistemas periódicos son en general más complicados de analizar que los 
sistemas originales que no son periódicos, pero el anterior se puede analizar sin dificultad si se lleva 
al plano z (esto es, mediante el enfoque de la función de transferencia pulso). 


Procedimientos generales para obtener funciones de transferencia pulso. Aquí se pre- 
sentarán procedimientos generales para obtener la función de transferencia pulso de un sistema que tiene 
un muestreador mediante impulsos en una de las entradas del sistema, como se muestra en la figura 3-24a). 

La función de transferencia pulso G(z) del sistema que se muestra en la figura 3-24a) es 

Y(2) _ 
X(2) 
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x(t) Y x*(t) 


$7 





ôr Y{z) 
Muestreador 
ficticio 


a) 


xit) yit) 
Gis) 
X(s) Yi) - 


b) 


Figura 3-24 a) Sistema en tiempo continuo con un muestreador mediante 
impulsos en la entrada; b) sistema en tiempo continuo. 


Después, considere el sistema que se muestra en la figura 3-24b). La función de transferencia G(s) está 
22da por 

Y(s) _ 

X(s) =G (s) 


Zs importante recordar que la función de transferencia pulso para este sistema no es Z [G(s)], debido 
z la ausencia del muestreador mediante impulsos. 

La presencia o ausencia del muestreador mediante impulsos es crucial en la determinación de la 
“unción de transferencia pulso del sistema, puesto que, por ejemplo, para el sistema que se muestra en 
-a figura 3-24a), la transformada de Laplace de la salida y(t) es 


Y(s) = G(s)X*(s) 
Por lo tanto, al tomar la transformada de Laplace asterisco de Y(s), se tiene 
Y*(s) = G*(s)X*(s) 
a. en términos de la transformada z, 
Y(2) = G(2)X(2) 


mientras que, para el sistema que se muestra en la figura 3-24b), la transformada de Laplace de la salida 
11) es 


Y (s) = G(s)X(s) 
lo cual da como resultado 


Y* (s) = [G(s)X(s)1* = [GX(s)1* 
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o, en términos de la transformada z, 
Y(2) = Z[Y(s)] = Z[G(s)X(s)] = 2[GX(s)] = GX) + G(z)X(2) 


El hecho de que la transformada z de G(s}X(s) no es igual a G(z}X(z) se estudiará con detalle más 
adelante en esta sección. 

Al estudiar la función de transferencia pulso, se supone que existe un muestreador a la entrada 
del elemento en consideración. La presencia o ausencia del muestreador a la salida del elemento (o el 
sistema) no afecta la función de transferencia pulso, debido a que, si el muestreador no está fisicamen- 
te presente en el lado de salida del sistema, es siempre posible suponer que el muestreador ficticio esté 
presente en la salida. Esto significa que, aunque la señal de salida es continua, se puede considerar los 
valores de la salida sólo en >= ÁT (k = 0, 1,2,...) y así se obtiene la secuencia y (kT). 

Observe que sólo para el caso donde la entrada al sistema G(s) es una señal muestreada median- 
te impulsos, la función de transferencia pulso está dada por 


G(z) = 2 [G(s)] 


Los ejemplos 3-4 y 3-5 demuestran los métodos para obtener la función de transferencia pulso. 
Ejemplo 3-4 
Obtenga la función de transferencia pulso G(z) del sistema que se muestra en la figura 3-24a), donde 


G(s) está dada por 


G(s) = 





s+a 
Observe que existe un muestreador a la entrada de G(s) y por tanto la función de transferencia pulso es 
G(2)= Z[G(s)]. 


Método 1. Refiriéndose a la tabla 2-1, se tiene 


1 1 
al; + A TS 


1 


O) == 





Por lo tanto, 


Método 2. La función de respuesta impulso del sistema se obtiene como sigue: 
g(t) = L '[G(s)] = e” 
Por lo tanto, 
g(kT) =e “T, k=0,1,2,... 


Por lo que, 


e 


Gl) = gr) *= Det = Y (ez) 
k=0 k=0 A 
sa niee 
= I-e ”z" 


www.FreeLibros.me 


Sección 3-5 La función de transferencia pulso 107 


Ejemplo 3-5 
Obtenga la función de transferencia pulso del sistema que se muestra en la figura 3-24a), donde G(s) está 
dada por 
l-e” 1 
G()= s sís +1) 


Observe que existe un muestreador en la entrada de G(s). 


Método 1. G(s) incluye el término (1 — e™™): por tanto. refiriéndose a la ecuación (3-32). se obtiene la 
función de transferencia pulso como sigue: 


. TeS 
G(z) = Z[G(s)] -z| = ma] 
h: 1 
AS em 
-a-enk tezh] 


A partir de la tabla 2-1, se puede encontrar la transformada z de cada uno de los términos de la expansión 
en fracciones parciales. De este modo, 





ab Tor 1 1 

A id dat 
MU O sl Ol Dl IA 
q (1 ma 25D es ez») (3-49) 


Método 2. La función de transferencia G(s) dada se puede escribir como sigue: 





1 1 1 
G(s)= (1-em>5-2+ 
AS ) $ s s+1 
Por tanto, al tomar la transformada inversa de Laplace. se tiene la siguiente función de respuesta impulso: 


gA = (1-1 +e 910) — [1 - T-14+e “Pr - T) 


g(kT) =(kT -1+e7*7) -[kT - T-1 + e “7-DJL((k — DT) 


Se + Te TD k=1,2,3,... 
= lo, k=0 


Entonces la función de transferencia pulso G(=) se puede obtener como sigue: 


G(z) = 5 g(kT)z™* 


w 
o 


Me 


[eT + T- e ODIA 27 1 T 
k 


Y 


0 


=(1-e) De "2 *+TXz2*+e-1-T 


k=0 


y ¿Mi 


MN aer 


Le a 
_(T-1+e 2 '+(1-e*- Te Pz? 
d-z25D0-e*"z2") 
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Función de transferencia pulso de elementos en cascada. Considere el sistema que se mues- 
tra en las figuras 3-25a) y b). Aquí se supone que los muestreadores están sincronizados y que tienen 
el mismo período de muestreo. Se mostrará que la función de transferencia pulso del sistema que se 
muestra en la figura 3-25a) es G(z)H(z), mientras que la del sistema que se muestra en la figura 3-25b) 
es Z[G(SH(S)]= Z[GH(S)] = GH(), que es diferente de G(z)H(z). 

Considere el sistema que se muestra en la figura 3-25a). A partir del diagrama se obtiene 


U(s) = G(s)X*(s) 
Y (s) = H(s)U*(s) AA 


Por tanto, al tomar la transformada de Laplace asterisco de cada una de estas dos ecuaciones, se 
obtiene como resultado 


U*(s) = G*(s)X*(s) 
Y*(s) = H*(s)jU*(s) 
En consecuencia, 


Y*(s) = H*(s)U*(s) = H*(s)G*(s)X*(s) 


Y*(s) = G*(s)H*(s)X* (s) 
En términos de la notación de la transformada z, 
Y(2) = G(2H(2)X(2) 


La función de transferencia pulso entre la salida y*(£) y la entrada x*(£) está por tanto dada mediante 


Y) 
= G(z)H(z 
XG) (z) 
x(t) Z xt) Els ult) u*(t) PR yit) y*ie) 
ô; ô; ôr 
a) 


ow A x“(t) y(t) O "te 
Gís) 


b) 
Figura 3-25 a) Sistema muestreado con un muestreador entre los elementos en cascada G(s) y H(s); b) sistema 


muestreado sin muestreador entre los elementos en cascada G(s) y H(s). 
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Después, considere el sistema que se muestra en la figura 3-25b). A partir del diagrama se 
ancuentra que 
Y(s) = C(SA(SAX*(s) = GH(s)X*(s) 
conde 
GH(s) = G(s)H(s) 
Al tomar la transformada de Laplace asterisco de Y(s), se tiene 
Y*(s) = [GH(s)]*X*(s) 
En términos de la notación de la transformada z, 
Y(z) = GAG)X(2) 
+ la función de transferencia pulso entre la salida y*(^) y la entrada x*(£) es 


Y(2) 
X(z) 





= GH(z) = Z[GH(s)] 


Observe que 
G(z)H(z) + GH(z) = Z[GH(s)] 


Por tanto, las funciones de transferencia pulso de los sistemas que se muestran en las figuras 3-25a) 
y b) son diferentes. Ahora se verificará esta aserción en el ejemplo 3-6. 


Ejemplo 3-6 
Considere los sistemas que se muestran en las figuras 3-26a) y b). Obtenga la función de transferencia 
pulso Y(=)/X(=) para cada uno de estos dos sistemas. 


xt) 4 x*(t) 1 ult) u*(t) 1 y(t) 


5, sta 87 s+b 





Gis) His} 


a) 





xA Y x*(t) 1 1 yit) 
ô; s+a s+b 


Gis) His) 


b} 


Figura 3-26 a) Sistema muestreado con un muestreador entre los elementos G(s) = 
Is + a) y Hs) = l/s + b). b) sistema muestreado sin muestreador entre los elementos 
G(s) y His). 
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Para el sistema de la figura 3-26a), las dos funciones de transferencia G(s) y H(s) están separadas 
por un muestreador. Se supone que los dos muestreadores que se presentan están sincronizados y tienen 
el mismo período de muestreo. La función de transferencia pulso para este sistema es 


Y(z) _ YG)U() 
X) U(z) Xz) = H(2)G(2) = G(z)H(z) 


Por tanto, 


Y(2) p 1 | 1 1 Saal 
X(z) ) GG)H() = -z| + lel; + 5] Ce ¿1 


Para el sistema que se muestra en la figura 3-26b), la función de transferencia pulso Y(z/X(z) se 
obtiene como sigue: 








Y(2) _ 1 1 
X(z X(2) SELGES 2; +as + z 


RS LA 
al L) 


POS EE EEN CA E 
b-a\l-e z" 1-e™®™ z"? 























Por lo tanto, 
Y(z J = | (eT = em" | 
X(z) — a| (1 — e7 z7} (1 — e™*" z~!) 


Claramente, se ve que las funciones de transferencia pulso de los dos sistemas son diferentes; esto es, 
G(z)H(2) + GH(2) 


Por tanto, se debe tener el cuidado de observar si hay o no un muestreador entre los dos elementos en 
cascada. 


Función de transferencia pulso de sistemas en lazo cerrado. En un sistema en lazo cerrado, 
la existencia o no de un muestreador de salida en el lazo hace que el comportamiento del sistema sea 
diferente. (Si existe un muestreador fuera del lazo, no habrá ninguna diferencia en la operación del lazo 


cerrado.) 
Considere el sistema de control en lazo cerrado que se muestra en la figura 3-27. En este sistema, 


el error actuante está muestreado. A partir del diagrama de bloques, 
Els) = R(s) — H(s)C(s) 
C(s) = G(s)E*(s) 





Figura 3-27 Sistema de control en lazo cerrado. 
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2 or tanto, 

Els) = R(s) — H(s)G(s)E*(s) 
zntonces, al tomar la transformada de Laplace asterisco, se obtiene 


E*(s) = R*(s) - GH*(s)E*(s) 


enia O: ` 
PUSTEGO 
Puesto que 
C*(s) = G*(s)E*(s) 
se obtiene 
sra — C (s)R* (s) 
CO=1F7 6H) 


En términos de la notación de la transformada z, la salida puede darse mediante 
G(z)R(z) 


SUS TE GHC] 


La transformada z inversa de esta última ecuación da los valores de la salida en los instantes de 
muestreo. [Observe que la salida real c(1) del sistema es una señal en tiempo continuo. La transforma- 
da z inversa de C(z) no dará la señal de salida en tiempo continuo c(s).] La función de transferencia 
pulso para este sistema en lazo cerrado es 


els 20) 


R(z) 1+ GH(z) (3=50) 


En la tabla 3-1 se muestran cinco configuraciones tipicas para sistemas de control en tiempo 
discreto en lazo cerrado. Aquí, los muestreadores están sincronizados y tienen el mismo período de 
muestreo. Para cada configuración, se muestra la salida correspondiente C(=). Nótese que algunos 
sistemas de control en tiempo discreto en lazo cerrado no se pueden representar mediante C(-/R(=) 
testo es, no tienen función de transferencia pulso) debido a que la señal de entrada R(s) no se puede 
separar de la dinámica del sistema. Aunque la función de transferencia pulso no pueda existir para 
ciertas configuraciones de sistemas, se pueden aplicar las mismas técnicas que se estudian en este 
capítulo para analizarlas. 


Función de transferencia pulso de un controlador digital. La función de transferencia pul- 
so de un controlador digital se puede obtener a partir de las características entrada-salida requeridas 
del controlador digital. 

Suponga que la entrada al controlador digital es e(k) y la salida es m(X). En general, la salida m(k) 
puede estar dada mediante el siguiente tipo de ecuación en diferencias: 


m(k) + aym(k — 1) + azm(k — 2) + +++ + am(k — n) 
= bye(k) + bie(k — 1) +--+ b,e(k —n) (3-51) 
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TABLA 3-1 CINCO CONFIGURACIONES TÍPICAS DE SISTEMAS DE CONTROL EN TIEMPO 
DISCRETO EN LAZO CERRADO 











GizIR(z) 


Cl = FF GHI 











Ciz) = Giz) Riz) 
1+ Gz Hiz) 
Ciz} 
— 
Ciz) = G,(121G,(RIz) 
1+ G,(21G,HIZ) 
Ciz) 
—— 
_ G2(z)G,Ríz) 
E G,G>HÍZ) 
Ciz) 
— 


GRIz) 
1 + GH) 


Ciz) = 
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-a transformada z de la ecuación (3-51) da como resultado 


M(2) + a, M(2) + a,2?M(2) ++: + az” M(z) 
= b E(z) + b,2 E(z) + -++ + b z™ E(z) 


(1 +az™! + az”? + +++ +a z™)M(z) = (bo + bi2 +-+- + b,2"")E(z) 


3 función de transferencia pulso G, (z) del controlador digital puede entonces estar dada mediante 
M bo + biz! +- + b,z™” 

ME) A E (3-52) 
E(z) 1+a12*+--*+a,z 


El uso de la función de transferencia pulso G, (z) en la forma de la ecuación (3-52) habilita al lector para 
analizar los sistemas de control digital en el plano z. 


Gp(z) = 


Función de transferencia pulso en lazo cerrado de un sistema de control digital. En la 
“gura 3-28a) se muestra un diagrama de bloques de un sistema de control digital. Aquí, el muestreador, 
21 convertidor A/D, el controlador digital, el retenedor de orden cero y el convertidor D/A producen 
na señal de control u(t) en tiempo continuo (constante por pedazos) para ser alimentada la planta. En 
a figura 3-28b) se muestran las funciones de transferencia de los bloques involucrados en el sistema. 

La función de transferencia del controlador digital se muestra como G} (s). En el sistema real la 







Retenedor de 
orden cero 
D/A 


cit) 


a) 


R(s} 





b) 


Figura 3-28 a) Diagrama de bloques de un sistema de control digital. b) diagrama de bloques equivalente que 
muestra las funciones de transferencia de los bloques. 
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computadora (controlador digital) resuelve una ecuación en diferencias cuya relación entrada-salida 
está dada mediante la función de transferencia pulso G,(z). 

En el presente sistema la señal de salida c(£) se alimenta de regreso para ser comparada con la 
señal de entrada r(£). La señal de error e(1) = r(t) —c(£) se muestrea, y la señal analógica se convierte en 
digital a través de un dispositivo A/D. La señal digital e(A7) se alimenta al controlador digital, el cual 
opera sobre la secuencia muestreada e(kT) de una manera adecuada para producir la señal n(k7). 

Esta relación conveniente entre las secuencias m(kT) y e(kT) se especifica mediante la función 
de transferencia pulso G, (z) del controlador digital. [Mediante la selección adecuada de los polos y 
ceros de G,(z), se puede generar un buen número de características entrada-salida.] A 

Refiriéndose a la figura 3-28b), se define 

1 == 


1 65) = 66) 


A partir de la figura 3-285), nótese que 
C(s) = G(s)G5(s)E*(s) 


C* (s) = G*(s)G5(s)E*(s) 

En términos de la notación de la transformada z, 

C(z) = G(2)Gp(z)E(z) 
Puesto que 

E(2) = R(z) - C(z) 
se tiene 
C(z) = Go(z)G(z)[R(z) - C(2)] 

y, por lo tanto, 

C) _ _Go(2)GG) 

R(z) 1+ Gp(z)G(z) 
La ecuación (3-53) da la función de transferencia pulso en lazo cerrado del sistema de control digital 
que se muestra en la figura 3-28b). El desempeño de dicho sistema en lazo cerrado se puede mejorar 
mediante la apropiada elección de G,(z), la función de transferencia pulso del controlador digital. 
Posteriormente se estudiará una variedad de formas para G,(z) a ser utilizadas en la obtención del 
desempeño óptimo para varios índices de desempeño dados. 


A continuación, se considerará sólo un caso sencillo, donde la función de transferencia pulso 
G(z) es del tipo PID (proporcional más integral más derivativo). 


(3-53) 


Función de transferencia pulso de un controlador PID digital. El esquema de control PID 
analógico ha sido usado de manera exitosa en muchos sistemas de control industrial por más de medio 
siglo. El principio básico del esquema de control PID es que actúa sobre la variable a ser manipulada 
a través de una apropiada combinación de las tres acciones de control: acción de control proporcional 
(donde la acción de control es proporcional a la señal de error actuante, la cual es la diferencia entre la 
entrada y la señal de realimentación); la acción de control integral (donde la acción de control es 
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>raporcional a la integral de la señal de error actuante) y la acción de control derivativa (donde la 
zcción de control es proporcional a la derivada de la señal de error actuante). 

En situaciones donde muchas plantas se controlan directamente mediante una sola computadora 
¿igital (como un esquema de control en el que se controlan desde unos cuantos lazos hasta cientos de 
żstos mediante un solo controlador digital), la mayoría de los lazos de control se pueden manipular 
mediante esquemas de control PID. 

La acción de control PID en controladores analógicos está dada por 


m(t) = K Kleo +3 1 fear + nE] 





jonde e(t) es la entrada al controlador (señal de error actuante), m(£) es la salida del controlador (la 
señal manipulada), K es la ganancia proporcional, T, es el tiempo integral (o tiempo de reajuste) y T} es 
el tiempo derivativo (o tiempo de adelanto). 
Para obtener la función de transferencia pulso del controlador PID digital, se puede discretizar 
la ecuación (3-54). Al aproximar el término integral mediante la sumatoria trapezoidal y el término 
Jerivativo mediante la diferencia de dos puntos, se obtiene 


MET) =K(ekT) +3 T0 AD p A+ <D, 
o 
m(kT) = Kleer) $ T56- ontan 
úl Z [e(kT) — e((k — Dn) (3-55) 
Se define 


=f(HT),  f(0)=0 
En la figura 3-29 se muestra la función f(4T). Entonces 


2 e((h — D7) +e(hT) _ = 2/0) 


Al tomar la transformada z de esta última ecuación, se obtiene 


z| e((h — 2 + eD- 2 [2/00 y 


h=1 


e((h — DT) + e(hT) 
2 





1F(2) — f0) 
1 

= == F 

1 Es z`! (z) 

(Para obtener esta última ecuación, refiérase al en di Nótese que 


F(z) = Z [fT] = 


E igi 
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| 


elt) 







e(0) > el) _ HT) 


elT) cia = AT) N 


0 T 27 3T t 


Figura 3-29 Diagrama que muestra la función f(AT). 


Por lo tanto, 
k 
e((h - DT) + ean] 1+27 
z| DTe] da 
2 2 1.3268) 
Entonces la transformada z de la ecuación (3-55) da como resultado 


z FA+zZ da ä 
mo =k 1 Ha 707z )IE(z) 





Esta última ecuación se puede rescribir como sigue: 











A r E aa 
M(2) = K 2T + TI + ri z lec) 
Z K, -1 
= Ke + 777a t Kol -z ) Elz) 
donde 
KT K, f i 
K =K 5T =K z 7 ganancia proporcional 
KT u 
K,= -y 7 ganancia integral 
K= = = ganancia derivativa 


Nótese que la ganancia proporcional K, para el controlador PID digital es más pequeña que la ga 
cia K para el controlador PID analógico por un factor de K//2. 

La función de transferencia pulso para el controlador PID digital se convierte en 
M(2) K, a 
—— = Kp + + Kpd- z` 3- 
Ez) E el pl cd) ( 
La función de transferencia pulso del controlador PID digital dada por la ecuación (3-56) se co! 
comúnmente como forma posicional del esquema de control PID. 





Gp(z) = 
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La otra forma por lo regular utilizada en el esquema de control PID digital es el esquema conoci- 
2: como forma de velocidad. Para obtener la ecuación del control PID en la forma de velocidad, se 
¿o 7.sidera la diferencia hacia atrás en m(kT), esto es, la diferencia entre m(kT ) y m(k- DT). Con 
¿unas suposiciones y manipulaciones, se obtiene 


R) = C) _ 
pza 
-Para obtener la ecuación (3-57), véase el problema A-3-17.] La ecuación (3-57) da el esquema de 
¿ntrol PID en la forma de velocidad. En la figura 3-30 se muestra un diagrama de-bloques de la 
“z2lización de un esquema de control PID digital en la forma de velocidad. Note que en la ecuación 
3-57) sólo el término del control integral incluye la entrada R(z). Por lo tanto, el término integral no se 
7 u2de excluir del controlador digital si éste se utiliza en la forma de velocidad. 

Una ventaja del esquema de control PID en la forma de velocidad es que no es necesaria la 
..clalización cuando se conmuta de operación manual a automática. De este modo, si existen cambios 
sDitos grandes en el punto de ajuste o en el inicio de la puesta en operación del proceso, el esquema 
=2 control PID en la forma de velocidad presenta mejores características de respuesta que aquél en la 
Tarma posicional. Otra ventaja del esquema de control PID en la forma de velocidad es que es útil en 

z supresión de correcciones excesivas en sistemas de control de procesos. 

Las leyes de control lineales en la forma de acciones de control PID, tanto en la forma posicional 
zomo en la de velocidad, son básicas en controles digitales debido a que con frecuencia dan solucio- 
zes satisfactorias a muchos problemas prácticos de control, en particular a problemas en control de 
crocesos. Observe que, en los controladores digitales, las leyes de control se pueden implantar 
mediante software, y por lo tanto las restricciones de hardware de los controladores PID se pueden 
:znorar por completo. (Para una comparación de las características de respuesta en frecuencia entre 
“os controladores PID analógicos y digitales, véase el problema A-3-16.) 


Yue 


M(2) = -KpC(z) + K, Ko(1 - 27C(2) (3-57) 


Ejemplo 3-7 
Considere el sistema de control con el controlador PID digital que se muestra en la figura 3-3 la). (El 
controlador PID está en la forma posicional.) Se supone que la función de transferencia de la planta es 





Figura 3-30 Diagrama de bloques de la realización del esquema de control PID en la forma de velocidad. 
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Retenedor de 
orden cero 


G,1s) 





(a) 









0.367977' + 0.264227? 
(1 - 0.36797 (1-27?) 





(b) 


Figura 3-31 a) Diagrama de bloques de un sistema de control; b) diagrama de bloques equivalente. 


d 
s(s + 1) 


y el período de muestreo T se supone de 1 segundo. Entonces la función de transferencia del retenedor 
orden cero se convierte en 


G(s) = 


l-e” 





G(s) = 


Puesto que 
l-e* 1 0.36797* + 0.2642z"? 
z| s s(s+ 5] TOS (1 — 0.3679z7})(1 - z7*) 
se puede redibujar el diagrama de bloques de la figura 3-31a) como se muestra en la figura 3-3 1b). 
Obténgase la respuesta escalón de este sistema cuando el controlador digital es un controlador 
con K»=1, K,=0,2, y Kp = 0.2. La función de transferencia pulso del controlador digital está dada 
l 1.4 — 1.427 + 0.277? 
l-z 
Entonces la función de transferencia pulso en lazo cerrado se convierte en 
C(z) _ _ Go(2)G(2) 
R(z2) 1+ Gp(2)G(2) 
_ 0,5151z' — 0.1452z ~? — 0.29632? + 0.0528z * 
© 1 — 1.85282 ° + 1.5906z? — 0.66422 * + 0.05282* 
Se utilizará el enfoque de MATLAB para obtener la respuesta escalón unitario. 
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Gp(z) = 
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Obtención de la respuesta transitoria con MATLAB. Suponga que se quiere la respuesta 
szalón unitario hasta k = 40. Entonces la entrada r(t) se puede escribir como 


r = ones(1,41) 


Z. programa para MATLAB que permite obtener la respuesta escalón unitario para este sistema se 


El 


2 
Tí 











Programa para MATLAB 3-1 











Y — Respuesta al escalón unitario 
num = [O 0.5151 -0.1452 -0.2963 0.0528]); 
den = [1 -1.8528 1.5906 -0.6642 0.0528]; 
r = ones(1,41); 

v=[0 40 0 2); 

axis(v); 

k = 0:40; 

c = filter(num,den,r); 

plot(k,c,'o”,k,c'-) 


grid 
title( Respuesta al escalón unitario”) 
xlabel(“k”) 





ylabel((“c(k)7) 





Respuesta al escalón unitario 


c(k) 








0 5 10 15 20 25 30 35 40 


Figura 3-32 Respuesta escalón unitario. 
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La respuesta de este sistema para una entrada rampa unitaria se puede obtener mediante el 
programa para MATLAB 3-2. La gráfica resultante se muestra en la figura 3-33. Observe que este 
sistema no presenta error en estado estacionario en la respuesta a la rampa. 


























| Programa para MATLAB 3-2 
% Respuesta a la rampa unitaria 
num = [O 05151 -0.1452 -0.2963 0.0528]; 
den = [1 -1.85281.5906 -0.6642 0.0528); 
axis(v); 
k = 0:40; 
r= [k]; 
c = filter(num,den,r); 
plot(k,c, o” k,c,-,k,k,—) 
grid 
title('Respuesta a la rampa unitaria”) 
xlebel('k”) 
ylebel(“c(k)) 
¡AA ES JJ] 
Respuesta a la rampa unitaria 
2 
g 








Figura 3-33 Respuesta a la rampa unitaria. 
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Comentarios. Los controladores PID para los sistemas de control de procesos como sistemas 
== : ¿7:rol de temperatura, sistemas de control de presión y sistemas de control de nivel de líquidos se 
+7: 7::zan normalmente en forma experimental. De hecho, en el control PID de cualquier planta indus- 
x2. zonde su dinámica no es bien conocida o no está bien definida, las variables del controlador (Kp. 
s- A-)se deben determinar de forma experimental. Dicha manera de determinar los parámetros o 
artinizarlos se puede llevar a cabo mediante cambios de tipo escalón en la señal de referencia o de 
ze _rnación. Se dispone de unos cuantos procedimientos establecidos para dicho propósito. Básica- 
Tari. la sintonización (el determinar las constantes Kp, K, y Kp) se logra mediante la variación 
sizmaática de los valores hasta que se obtienen buenas características de respuesta. 

Para los controladores PID digitales utilizados para sistemas de control de procesos, el período 
z= muestreo se debe elegir de manera apropiada. Muchos sistemas de control de procesos tienen 
: :".santes de tiempo ligeramente grandes. Una receta de cocina en la elección del período de muestreo 

teriodo de muestreo T = 277/w,, donde w, es la frecuencia de muestreo) en sistemas de control de 
Tr xeasos. es que para sistemas de control de temperatura el período de muestreo debe ser de 10 a 30 
sz¿undos. para sistemas de control de presión de | a 5 segundos y para sistemas de control de nivel 
< ..quidos de l a 10 segundos. 





iae 





Obtención de la respuesta entre instantes de muestreo consecutivos. El análisis de la trans- 
7:mmada z no dará información sobre la respuesta entre dos instantes de muestreo consecutivos. En 
zzsos ordinarios esto no es serio, debido a que si el teorema de muestreo se satisface, entonces la 
¿zida no variará mucho entre cualquiera de estos dos instantes de muestreo consecutivos. En ciertos 
:zs0s. sin embargo, se puede necesitar la respuesta entre instantes de muestreo consecutivos. 

Se dispone de tres métodos de uso común que permiten conocer la respuesta entre dos instan- 
zs de muestreo consecutivos: 


l. El método de la transformada de Laplace 
2. El método de la transformada z modificada 
3. El método en el espacio de estados 


Aqui se estudiará brevemente el método de la transformada de Laplace. El método de la transformada 
z modificada se presenta en el apéndice B. (Aquellos lectores interesados en la transformada z modi- 
T.cada deberán leer la sección B-4.) El método en el espacio de estados se estudiará en la sección 5-5. 


El método de la transformada de Laplace. Considere, por ejemplo, el sistema que se muestra 
en la figura 3-27. La salida C(s) se puede dar mediante 


Cls) = GEN) = CO 
De este modo, 
c(t) = £”[C(s)] = na 97 (3-59) 


La ecuación (3-59) dará la respuesta en tiempo continuo c(t). Por tanto, la respuesta en cualquier 
tiempo entre dos instantes de muestreo consecutivos se puede calcular con la ecuación (3-59). [Véase 
el problema A-3-18 para una muestra del cálculo del segundo miembro de la ecuación (3-59).] 
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36 REALIZACIÓN DE CONTROLADORES 
Y FILTROS DIGITALES 


En esta sección se estudian los métodos de realización para funciones de transferencia pulso que 

representan controladores y filtros digitales. La realización de controladores y filtros digitales puede 

incluir ya sea software, hardware o ambos. En general, la “realización” de funciones de transferencia 

pulso significa determinar la configuración fisica para la combinación apropiada de operaciones 
aritméticas y de almacenamiento. 

i En una realización de software se obtienen programas de computadora para la computadora 
digital involucrada. En una realización de hardware se construye un procesador de propósito especial 
mediante circuitos tales como sumadores digitales, multiplicadores y elementos de retardo (registros 
de corrimiento con un período de muestreo T como un tiempo de retardo unitario). 

En el campo del procesamiento digital de señales, un filtro digital es un algoritmo de cálculo 
que convierte una secuencia de números de entrada en una secuencia de salida, de modo que las 
características de la señal se cambien de una manera predeterminada. Esto es, un filtro digital procesa 
una señal digital pues permite el paso de algunas componentes de frecuencia deseadas de la señal 
digital de entrada y rechaza algunas otras no deseadas. En términos generales, un controlador digital 
es una forma de filtro digital. 

Observe que hay diferencias importantes entre el procesamiento digital de señales utilizado en 
comunicaciones y el que se utiliza en control. En control digital el procesamiento de señales se debe 
hacer en tiempo real. En comunicaciones, el procesamiento de señales no se necesita hacer en tiempo 
real, y por lo tanto se puede tolerar retardos en el procesamiento para mejorar la exactitud. 

Esta sección trata de las realizaciones en diagramas de bloques de filtros digitales que emplean 
elementos de retraso, sumadores y multiplicadores. Aquí se estudiarán algunas estructuras diferentes 
de realizaciones en diagramas de bloques. Dichas realizaciones en diagramas de bloques se pueden 
utilizar como base para un diseño de software o hardware. De hecho, una vez que se completa el 
diagrama de bloques de la realización, la realización fisica en hardware o software es directa. Observe 
que en el diagrama de bloques de una realización, la función de transferencia pulso de z ~’ representa 
un retardo de una unidad de tiempo (véase la figura 3-34). (Observe también que en el plano s, z ~“ 
corresponde a un retardo puro e””.) 

A continuación se verán los filtros digitales que se emplean con propósitos de filtrado y 
control. La forma general de la función de transferencia pulso entre la salida Y(z) y la entrada X(z) está 
dada por 


== Y() ye bo + biz"! + baz” +--+ bmz™ 


RAS Xo Lar taa E TaM (3-60) 


donde las a, y las b, son para muchos controladores digitales coeficientes reales (algunos de éstos 
pueden ser cero). La función de transferencia pulso es de esta forma. Por ejemplo, la función de 
transferencia pulso para el controlador PID dado por la ecuación (3-56) se puede expresar en la forma 
de la ecuación (3-60), como sigue: 


Al 21 x(k = 1) Figura 3-34 Función de transferencia pulso mostrando 
X(2) z0 Xiz un retardo de una unidad de tiempo. 
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(Kp + K; + Kp) T (Kp + 2Kp)z™! + Kpz? 

Gpíz) = =1 
=z 

z bo + biz" E bz? 

l1+a2z'+a,z7? 


a= -i 

a=0 

bo = Ke + K¡ + Kp 
b, = -(Kp + 2Kp) 


b, = Kp 
Ahora se estudiarán las formas de programación directa y estándar de los filtros digitales. En 


—.itiplicadores en el diagrama de bloques de la realización. Aquellos esquemas de diagramas de 
>.0ques donde los coeficientes a, y b, aparecen de manera directa como multiplicadores se denominan 


-siructuras directas. 


Programación directa. Considere el filtro digital dado por la ecuación (3-60). Nótese que la 
znción de transferencia pulso tiene n polos y m ceros. En la figura 3-35 se muestra un diagrama de 
z oques de la realización del filtro. El hecho de que este diagrama de bloques representa la ecuación 


5-60) se puede ver fácilmente, puesto que a partir del diagrama de bloques se tiene 
Y(z) = -a,2  Y(2) — aaz”? Y(z) — -© — 4,2 "Y(z) + byX(2) 
+ bız X(2) ++- + baz ™X(z) 


Al reordenar esta última ecuación se obtiene la ecuación (3-60). 





Figura 3-35 Diagrama de bloques de la realización de un filtro que muestra la programación directa. 
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Este tipo de realización se denomina programación directa. Programación directa significa que 
se obtiene la realización del numerador y el denominador de la función de transferencia pulso median- 
te conjuntos de elementos de retraso por separado. El numerador utiliza un conjunto de m elementos 
de retraso y el denominador utiliza un conjunto diferente de n elementos de retraso. De esta manera, 
el número total de elementos de retraso utilizados en la programación directa es m + n. 

El número de elementos de retraso empleados en la programación directa se puede reducir. De 
hecho, el número de elementos de retraso se puede reducir de n + m a n (donde n > m). El método de 
programación que utiliza el número mínimo posible de elementos de retraso se denomina programa- 
ción estándar. 

En la práctica, se trata de utilizar el número mínimo de elementos de retraso en la realización de 
una función de transferencia pulso dada. Por tanto, la programación directa que requiere un número 
de elementos de retraso mayor que el valor mínimo es más o menos de valor académico más que de 
valor práctico. 


Programación estándar. Como se estableció previamente, el número de elementos de retraso re- 
queridos en la programación directa se puede reducir. De hecho, el número de elementos de retraso utili- 
zados en la realización de la función de transferencia pulso dada por la ecuación (3-60) se puede reducir de 
n+ man (donde n > m) mediante el reacomodo del diagrama de bloques, como se estudiará aquí. 

Primero, se rescribe la función de transferencia pulso Y(z)/X(z) dada por la ecuación (3-60) como 
sigue: 


YE) _ YE) HG) 
X(z) H(z) X(2) 





1 
A =1 -2 a IS AS AP E 
= (bo + bız + b,z + + bnz EN aoni iz" 
donde 
Y(2) >i 3 E 
== + + + dd 3- 1 
HG) bo + biz bız bmz (3-61) 
y 
H(z) 1 





X(z) “i+az +az? +t o +az” (2-92) 
Entonces, se dibuja el diagrama de bloques para los sistemas dados por las ecuaciones (3-61) y (3-62). 
respectivamente. Para dibujar el diagrama de bloques, se puede rescribir la ecuación (3-61) como 


Y(2) = bo H(z) + b12 H(z) + > + bmz™ H(z) (3-63) 
y la ecuación (3-62) como 
H(z) = X(2) - az 'H(2) — a22 *H(2) — :::- anz ™ H(z) (3-64) 


Entonces, a partir de la ecuación (3-63), se obtiene la figura 3-36a). De modo similar, se obtiene la figura 
3-364) a partir de la ecuación (3-64). La combinación de estos dos diagramas de bloques da el diagrama 
de bloques para el filtro digital G(z), como se muestra en la figura 3-36c). El diagrama de bloques de la 
realización como se presentó aquí está basado en la programación estándar. Note que sólo se utilizan 
n elementos de retraso. Los coeficientes a,, a», ..., a, aparecen como elementos de realimentación, y 


los coeficientes bo, b,,...., Dm aparecen, somos ispentos de prealimentación. 





c} 


Figura 3-36 a) Diagrama de bloques de la realización de la ecuación (3-63); b) diagrama 
de bloques de la realización de la ecuación (3-64); c) diagrama de bloques de la realización 
del filtro digital dado por la ecuación (3-60) mediante programación estándar. 
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Los diagramas de bloques en las figuras 3-35 y 3-36c) son equivalentes, pero el último utiliza n 
elementos de retraso, mientras que el formal utiliza n + m elementos de retraso. Obviamente, se prefiere 
el último diagrama, el cual utiliza un número más pequeño de elementos de retraso. 


Comentarios. Observe primero que utilizar un número mínimo de elementos de retraso ahorra 
espacio en memoria en los controladores digitales. También utilizar un número mínimo de puntos suma 
es conveniente. 

En la realización de controladores o filtros digitales, es importante tener un buen nivel de 
exactitud. En esencia, son tres las fuentes de error que afectan la exactitud: 


1. Elerror debido a la cuantificación de la señal de entrada en un número finito de niveles discre- 
tos. (En el capítulo 1 se discutió este tipo de error, el cual se puede considerar como una fuente 
aditiva de ruido, denominado ruido de cuantificación. Éste se puede considerar como ruido 
blanco; la varianza del ruido es o? = Q?/12.) 


2. El error debido a la acumulación de los errores de redondeo en las operaciones aritméticas en el 
sistema digital. 


3. El error debido a la cuantificación de los coeficientes a, y b, de la función de transferencia pul- 
so. Este error puede hacerse más grande a medida que el orden de la función de transferencia 
pulso se incrementa. Esto es, en filtros digitales de orden superior en la estructura directa, los 
errores pequeños en los coeficientes a, y b, causan grandes errores en las localizaciones de los 
polos y los ceros del filtro digital. 


Estos tres errores surgen debido a las limitaciones prácticas del número de bits que representa 
a las muestras de la señal y a los coeficientes. Observe que el tercer tipo de error se puede reducir 
mediante la descomposición matemática de las funciones de transferencia pulso de orden superior en 
una combinación de funciones de transferencia pulso de orden pequeño, De esta forma, el sistema se 
puede hacer menos sensible a la inexactitud de los coeficientes. 

Para la descomposición de funciones de transferencia pulso a fin de evitar el problema de 
sensibilidad de los coeficientes, se utilizan por lo regular los tres enfoques siguientes. 


1. Programación en serie 
2. Programación en paralelo 
3. Programación en escalera 


Ahora se estudiarán estas tres formas de programación. 


Programación en serie. El primer enfoque empleado para evitar el problema de sensibilidad 
consiste en implantar la función de transferencia pulso G(z) como una conexión en serie de funciones 
de transferencia pulso de primero y segundo orden. Si G(z) se puede escribir como un producto de 
funciones de transferencia pulso G,(z), Gx(z), . . . , G(z), O 


G(z) = Gi(2)G Az) + >: Gp(2) 


entonces el filtro digital para G(z) puede estar dado como una conexión en serie de las componentes 
de filtros digitales G,(2), Ga(2), . - . , G,(z), como se muestra en la figura 3-37. 

En la mayoría de los casos, las G(2) (i= 1, 2, . . . , p) se eligen como funciones de primero o 
segundo orden. Si los polos y ceros de G(z) son conocidos, G (z), G(z), . . . , G,(z) se pueden obtener 
agrupando un par de polos complejos conjugados y un par de ceros conjugados para producir una 
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x(k) y(k) 
G, (z) Gz —----- G 
xiz) i $ pie Yiz) 


Figura 3-37 Filtro digital G(=) descompuesto en una conexión en serie de G,{2), 
Gh tes G2). 


runción de segundo orden, o agrupando polos y ceros reales para producir funciones ya sea de 
primero o segundo orden. Por supuesto, es posible agrupar dos ceros reales con un par de polos 
complejos conjugados, o viceversa. La agrupación es, en un sentido, arbitraria. Es preferible hacer la 
agrupación de formas diferentes para ver cuál es la mejor con respecto al número de operaciones 
aritméticas requeridas, los rangos de los coeficientes, etcétera. 

Para resumir, G(z) se puede descomponer como sigue: 


G(z) = Gi(z2)G:{z): +: Gp(2) 


Ltd f Lez tp? 
ail + azal + az + diz? 





Los diagramas de bloques para 





Y(z) PA 1+ biz" 
X(z) 1+az2" (2203) 
y para 
Y Fazi tpz? 
(z) Z 1 eiz fiz (3-66) 


X(z) 1+02*'1+d 2? 


se muestran en las figuras 3-38a) y b), respectivamente. El diagrama de bloques para el filtro digital 
G(z) es una conexión en serie de p componentes de filtros digitales como los que se muestran en las 
figuras 3-38a) y b). 


Programación en paralelo. El segundo enfoque para evitar el problema de sensibilidad de 
los coeficientes es expandir la función de transferencia pulso G(z) en fracciones parciales. Si G(z) se 
expande como una suma de A, G (z), G(2), . . ., G,(z), o de modo que 


G(2) = A + Gi(z) + GaAz) + +: + Ga(z) 


donde 4 es simplemente una constante, entonces el diagrama de bloques para el filtro digital G(z) se 
puede obtener como una conexión en paralelo de q + 1 filtros digitales, como se muestra en la figura 3-39. 

Debido a la presencia del término constante 4, las funciones de primero y segundo orden se 
pueden elegir en formas sencillas. Esto es, G(z) se puede expresar como 


G(2) = A + Gi(2) + Gz) + --- + Ga(z) 


Y 64) 


i=j+1 


J 
i=l 


j b; E e+ fiz! 
= A +») + m E a 
> i 2i +z! + d;z? 
El diagrama de bloques para 
Y(z) z: b; 


X(z)_l1+az'! 
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Ya _ 1+ ez +f? 





Xiz) 1+c,27 +d z? 


b) 


Figura 3-38 a) Representación mediante diagrama de bloques de la ecuación 
(3-65); b) representación mediante diagrama de bloques de la ecuación (3-66). 


y el correspondiente para 
YE)___earfz” 
X(z) 1+0a23*+d2? 
se muestran en las figuras 3-40a) y b), respectivamente. La conexión en paralelo de q + 1 compone 


de filtros digitales como se muestra en la figura 3-40 producirá el diagrama de bloques para el 
digital G(z). 


G- 


Programación en escalera. El tercer enfoque para evitar el problema de sensibilidad de 
coeficientes es implantar una estructura en escalera, esto es, expandir la función de transfere: 
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Figura 3-39 Filtro digital G(=) 
descompuesto en una conexión en paralelo 
de A, Gi}, GA)... .., G2). 





7 -1so G(z) en la siguiente fracción continuada y programar de acuerdo con esta ecuación: 


1 
G(2) = Ap + 
1 
Biz + 1 
A + 7 
Baz + (3-69) 
Aj + l 
B,z + A 
n A, 
El método de programación basado es este esquema se denomina programación en escalera. Definase 
1 ; 
GU) = ==> ¿=1,2,...,n- 1 
O = gz 1 GO) 
1 
GUA) = zz» ¿=1,2,...,n-= 1 
(2) A; + GA) 
GPe) = — 
+ — 
B,z PE 


Entonces G(z) se puede escribir como 
G(z) = Ay + Gi%(2) 
i www.FreeLibros.me, 
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Ya _ a 
Xiz) 1+az" 





a) 





Yiz) _ e, + fiz 





Xiz)  1+02 + dz? 


b} 


Figura 3-40 a) Representación mediante diagrama de bloques de la ecuación 
(3-67); b) representación mediante diagrama de bloques de la ecuación (3-68). 


Se explicará este método de programación mediante un ejemplo sencillo donde 7 = 2. Esto 


G(2z) = Ao + l 


Biz + 
Ái + 


www.FreeLibros.me 


2atción 3-6 Realización de controladores y filtros digitales 131 


“Mediante el uso de las funciones a 2), GP) y Gi” (2), la función de transferencia G(z) se puede 
zscribir como sigue: 
1 
1 

a A, + GP (2) 

1 
Bız + GP) 
= A, + GP(2) 


G(z) = Ao + 
Biz 


= Ao + 


a» B ue 
Observe que G! (2) se puede escribir como 


Y) 1 


(B) = A 
ADE AO Bar G 


(3-70) 
X (2) - GAY) = B:2Y(2) 


El diagrama de bloques para la dal (2) dada por la ecuación (3-70) se muestra en la figura 3-4 la). De 
manera similar, el diagrama de bloques para la GM, que puede estar dado por 





b) 


Figura 3-41 a) Diagrama de bloques para G!” (z) dado por la ecuación 
(3-70), b) diagrama de bloques para G” (z) dado por la ecuación (3-71). 
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A = YG) = A j 
LO) A F GAO o 


X(2) — G(z)YAz) = A¡Y(2) 
se puede dibujar como se muestra en la figura 3-41b). Observe que 


1 

(4) S 

G (z) Az 

Mediante la combinación de las dos componentes de los filtros digitales, como se muestra en la 

figura 3-42a), es posible dibujar el diagrama de bloques del filtro digital G(z) como puede apreciarse en 
la figura 3-42b). [Observe que las figuras 3-42a) y b) corresponden al caso donde n = 2.] 


Comentarios. Los filtros digitales basados en la programación en escalera tienen ventajas 
respecto a la sensibilidad y exactitud de los coeficientes. La realización de la estructura en escalera se 
logra mediante la expansión de la G(z) en fracciones continuadas alrededor del origen. 

Se observa que la expansión en fracciones continuadas dada por la ecuación (3-69) no es la 
única forma posible. Existen algunas maneras diferentes para construir la estructura de escalera. Por 


A, 





a) b) 


Figura 3-42 a) Diagramas de bloques componentes para la programación en escalera de G(z) dada por la 
ecuación (3-69) cuando n = 2; b) combinación de los diagramas de bloques componentes que muestra la 
programación en escalera de G(z). 
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ejemplo, un filtro digital G(z) se puede estructurar como una expansión en la forma de fracciones 
continuadas alrededor del origen en términos de z ~™', como sigue: 


Gl) = Â + . . 
Biz! + 1 
Â + : 
Baz" + 
Ân + 1 
„z` + A 
A 


n 


También, en lugar de G(z), su inversa 1/G(z) se puede expandir en la forma de fracciones continuadas 
en términos de z o de z * con la finalidad de llevar a cabo la programación en escalera. 


Ejemplo 3-8 
Obtenga los diagramas de bloques para la función de transferencia pulso del sistema (un filtro digital) 
mediante l) programación directa, 2) programación estándar y 3) programación en escalera: 


Y _ _2-0.67” 
xXx) OO Iros 
1. Programación directa. Puesto que la función de transferencia pulso dada se puede escribir como 
Y(z) = -0.5z* Y(2) + 2X(2) - 0.6z* X(z) 


la programación directa da como resultado el diagrama de bloques que se muestra en la figura 3-43. Note 
que se necesitan dos elementos de retraso. 


2. Programación estándar Primero se rescribirá la función de transferencia pulso como sigue: 





Y) YE) HG) laos — 2 
Xz) HG@)X() NON ETET 
donde 
Y(z) Sl 
Ho 1703 
b4 





Figura 3-43 Diagrama de bloques de la realización de H=/X(=) = (2 — 0.6 Y(1 + 
0.577?) (programación directa). 
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Los diagramas de bloques de las realizaciones de estas dos últimas ecuaciones se muestran en la 
figura 3-44a) y b), respectivamente. Si se combinan estos dos diagramas, se obtiene el diagrama de bloques 
para el filtro digital Y(z)/X(2), como se muestra en la figura 3-44c). Nótese que el número de elementos de 
retraso requeridos se ha reducido a 1 mediante la programación estándar. 


3. Programación en escalera. Primero se rescribirá Y(z)/X(z) en la forma de escalera como sigue: 











Y(z) 2z — 0.6 —1.6 1 
= (2) = —— = + = 2 + ——— 
X(2) z+0.5 z+0.5 -0.6252 + 1 
-3.2 
De este modo, 4 = 2 y 
GPe) = —— | 
—0.625z + a “16?” 0.3125 








c) 


Figura 3-44 a) Diagrama de bloques de la realización de Y(2/H(2) = 1 — 0.32”; 
b) diagrama de bloques de la realización de H(2/X(2) = 2/(1 + 0.5271) c) 
combinación de los diagramas de bloques de los incisos a) y b) (programación 
estándar). 
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Figura 3-45 Diagrama de bloques de la 
realización de Y(z)/X(2) = (2 — 0.62 YW(1 + 0.57) 
(programación en escalera). 





Por tanto, se obtiene 


Y(z) = 2X(2) + GP (2)X(z) 


Refiriéndose a la figura 3-4 la) para el diagrama de bloques de G/” (z), se obtiene el diagrama de bloques del 
filtro digital Y(=)/X(=) como se muestra en la figura 3-45, Nótese que sólo se necesita un elemento de 
retraso. 


Filtro de respuesta al impulso infinita y filtro de respuesta al impulso finita. Los filtros 
digitales se pueden clasificar de acuerdo con la duración de la respuesta al impulso. Considere un 
filtro digital definido mediante la siguiente función de transferencia pulso: 

Y(z) bb+biz +- + bpz” 
XG) 1+a2*+a,2?*+--+a0,2" 





(3-72) 


donde n > m. En términos de la ecuación en diferencias, 
y(k) = =a y(k — 1) — a2y(k — 2) = +: — any(k =n) 
+ dbox(k) + b,x(k — 1) +-+ + bax(k — m) 


La respuesta al impulso del filtro digital definido por la ecuación (3-72), donde se supone que no todas 
las a, son cero, tiene un número infinito de muestras diferentes de cero, aunque sus magnitudes 
puedan hacerse despreciablemente pequeñas a medida que k se incrementa. Este tipo de filtro digital 
se denomina filtro de respuesta al impulso infinita. Dicho filtro digital también se denomina filtro 
recursivo, debido a que los valores anteriores de la salida junto con los valores presentes y pasados 
de la entrada se utilizan en el procesamiento de la señal para obtener el valor actual de la salida y(k). 
Debido a la naturaleza recursiva, se pueden acumular los errores de las salidas anteriores. Un filtro 
recursivo se puede reconocer mediante la presencia de a, y b, en el diagrama de bloques de la realiza- 
ción. 
Ahora, considere un filtro digital donde los coeficientes a, son todos cero, o donde 
Y) 
X(z) 


En términos de la ecuación en diferencias 
y(k) = box(k) + bix(k — 1) + -+ + bax(k — m) 


La respuesta al impulso del filtro digital definido mediante la ecuación (3-73) está limitado a un número 
finito de muestras definidas sobre un rango finito de intervalos de tiempo; esto es, la respuesta 





= by + biz + baz? + eee + baz ™ (3-73) 
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impulso es una secuencia finita. Este tipo de filtro se denomina filtro de respuesta al impulso finita. 
También se denomina filtro no recursivo, o filtro de promedio móvil. 

En una realización no recursiva, el valor presente de la salida depende sólo de los valores 
presente y pasados de la entrada. El filtro de respuesta al impulso finita se puede reconocer por la 
ausencia de las a, en el diagrama de bloques de la realización. 


Realización de un filtro de respuesta al impulso finita. Ahora se considerará la realización 
de un filtro de respuesta al impulso finita. 

La secuencia de la respuesta al impulso finita (secuencia de ponderación) del filtro digital se 
define como g(kT). Si la entrada x(kT) se aplica a este filtro, entonces la salida y(kT) puede estar dada 
mediante 


y(kT) = Y g(hT)x(kT — hT) 


= g(0)x(kT) + g(T)x((k — 1)T) + --: + g(kT)x(0) (3-74) 


La salida y(kT) es una sumatoria de convolución de la señal de entrada y la secuencia de la respuesta 
al impulso. El segundo miembro de la ecuación (3-74) consta de k + 1 términos. De este modo, la salida 
y(kT) está dada en términos de las k entradas anteriores x(0), (7), ...,x((*— 1)7) y la entrada actual 
x(kT). Note que a medida que k se incrementa no es físicamente posible procesar todos los valores 
anteriores de la entrada para producir la salida actual. Se necesita limitar el número de valores anterio- 
res de la entrada a procesar. 

Suponga que se decide emplear los N inmediatos valores anteriores de la entrada x((k—1)7), x((k 
-2)T), ...,x((k-— NT) y la entrada actual x(kT). Esto es equivalente a aproximar el segundo miembro 
de la ecuación (3-74) mediante los N + 1 valores anteriores de la entrada más reciente incluyendo el 
valor actual, o 


y (KT) = g(0)-xT) + g(T)x((k — 1)T) + ==> + g(NT)x((k — N)T) (3-75) 


Debido a que la ecuación (3-75) es una ecuación en diferencias, el correspondiente filtro digital en el 
plano z se puede obtener como sigue. Al tomar la transformada z de la ecuación (3-75) se tiene 


Y (2) = g(0)X(2) + g(T)z" X(2) + --- + g(NT)2""X(z) (3-76) 





Figura 3-46 Diagrama de bloques de la realización de la ecuación (3-76). 
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En la figura 3-46 se muestra un diagrama de bloques de la realización de este filtro. 
Las características del filtro de respuesta al impulso finita se pueden resumir como sigue: 


1. El filtro de respuesta al impulso finita es no recursivo. De esta manera, debido a la falta de 
realimentación, la acumulación de errores de las salidas anteriores se puede evitar en el proce- 
samiento de la señal. 

2. La implantación del filtro de respuesta al impulso finita no requiere de realimentación, de modo 
que la programación directa y la programación estándar son idénticas. También, la implantación 
se puede lograr mediante convolución de alta velocidad mediante la transformada rápida de 
Fourier, 

3. Los polos de la función de transferencia pulso del filtro de respuesta al impulso finita están en 
el origen, y por lo tanto éste es siempre estable. 

4. Si la señal de entrada incluye componentes de alta frecuencia, entonces el número de elementos 
de retraso necesarios en el filtro de respuesta al impulso finita se incrementa y la cantidad de 
tiempo de retraso se alarga. (Esto es una desventaja del filtro de respuesta al impulso finita 
comparado con el filtro de respuesta al impulso infinita.) 


Ejemplo 3-9 
El filtro digital que se estudió en el ejemplo 3-8 es un filtro recursivo. Modifique este filtro y haga su 
realización como un filtro no recursivo. Luego obtenga la respuesta de este filtro no recursivo a una entrada 
delta de Kronecker. 
Al dividir el numerador del filtro recursivo G(z) entre el denominador, se obtiene 


2 — 0.627! 
1 +0.57? 
= 2 — 1.6z7! + 0.827? — 0.42 + 0.2z7* — 0.12 + 0.052 — 0.025z 7 + 


G(z)= 


7 


Al truncar de manera arbitraria esta serie en z ~’, se obtiene el filtro no recursivo adecuado, como sigue 


Y(z) i 3 -3 Ed E 
— e daa y + y a x + K pu Ñ $ 
Mo 1.62 0.8z 0.4z 0.2z 0.1z 


+ 0.0527 — 0.0252” (3-77) 

En la figura 3-47 se muestra el diagrama de bloques para este filtro digital no recursivo. Note que se requiere 
de un número grande de elementos de retraso para obtener un buen nivel de exactitud. 

Observe que el filtro digital es la transformada z de la secuencia de la respuesta al impulso, la 


transformada z inversa del filtro digital da la secuencia de la respuesta al impulso. Al tomar la transformada 
z inversa del filtro no recursivo dado por la ecuación (3-77), se obtiene 


y(KT) = 2x(kT) — 1.6x((k — 1)T) + 0.8x((k — JT) — 0.4x((k — 3)T) 
+ 0.2x((k — 4)T) — 0.Lx((k — 5)T) + 0.05x((k — 6)T) — 0.025x((k — 7)T) 


Para la entrada delta de Kronecker, donde x(0) = 1 y x(k7) = 0 para k + 0, esta última ecuación da como 
resultado 


y(0) =2 
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Y(z) 


Figura 3-47 Diagrama de bloques para el filtro digital dado por la ecuación (3-77) (forma 
no recursiva). 


yQT) = 0.8 
yT) = -0.4 
y(4T) = 0.2 
y(5T) = -0.1 
y(6T) = 0.05 
y(T) = -0.025 


La secuencia de la respuesta al impulso para este filtro digital se muestra en la figura 3-48. 


yik) 


Figura 3-48 Secuencia de la respuesta al 
impulso para el filtro digital dado por la 
ecuación (3-77). 





PROBLEMAS DE EJEMPLO Y SOLUCIONES 


Problema A-3-1 
Considere un retenedor de orden cero precedido por un muestreador. La figura 3-49 muestra la entrada x(t} 
al muestreador y la salida y(t) del retenedor de orden cero. En el retenedor de orden cero el valor de la última 
muestra se retiene hasta que se toma la siguiente muestra. 
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yit) 


x(t) 


Figura 3-49 Curvas de entrada y salida para 
0 T 27 37 AT 57 6r 7T ¿ un retenedor de orden cero. 


Obtenga la expresión para y(1). Luego encuentre Y(s) y obtenga la función de transferencia del 
retenedor de orden cero. 


Solución A partir de la figura 3-49 se obtiene 
y (0) = OUH = UC T)] + (DI - T) — 1(0 — 27)] 
+xQT)I - 2T) = 1(t - 3T) + +" 


La transformada de Laplace de y(r) es 


Y(s) = sof} S e>) + Koc = = 











$ s 
eT e 37 
+ er) ES ). e 
Tee -Ts -27s 
= — ko +x(De * + x(2T)e "+ --] 
1 on er x 
= — xX (s) 


donde 
X*(s)= È xkD)e +” = y $ x(kT)8(: — «n| 
k=0 k=0 
La función de transferencia del retenedor de orden cero es, de este modo, 
Y(s) _1-e” 
"o X*(s) s 





Problema A-3-2 
Considere un retenedor de primer orden precedido por un muestreador. La entrada al muestreador es x(£) 
y la salida del retenedor de primer orden es y(£). En el retenedor de primer orden la salida v(£) para ÁT < t 
<(k+ DT es la línea recta que es la extrapolación de los dos valores muestreados precedentes, x((k — 1)T) 
y x(kT), como se muestra en la figura 3-50. La ecuación para la salida v(£) es 


y=! -ET ERT) — x((k - 1)T)] + x(kT), kT=t< (k +1)T (3-78) 





Obtenga la función de transferencia del retenedor de primer orden. suponiendo una función sencilla 
tal como un impulso en £ = 0 como la entrada x(t). 
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Figura 3-50 Curvas de entrada y salida 
-T 0 T 27 3T 4T 5T 6T + Para un retenedor de primer orden. 


Solución Para una entrada impulso de magnitud x(0) tal que x*(*) = x(0)6(s), la salida y(t) dada por la 
ecuación (3-78) se convierte en la forma de onda que se muestra en la figura 3-51. La expresión numérica 
para y(t) es 


y) = soi + shio = [xo + 2x(0)É he -T) 





+ [xo + x(0)! 5 





he - 2T) 


Por lo tanto, 











1 1 er es -2Ts e? 
Y(s) = sof} + 2) - xof Paii 5) + xo] AA ) 
1 1 


= x(0)(1 — 2e7” + em + 4) 


Ts+1 Rea 
= (0) 20 e a 


Figura 3-51 Curva de salida del retenedor 
de primer orden cuando la entrada es una 
función impulso. 
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Por tanto 
X*(s) = LL (0) = L[x(0)8(0)] = x(0) 


la función de transferencia del retenedor de primer orden se obtiene como sigue: 


Y) _Ts+1(1-e "Y 
Gmís) = X*(s) ET S 
Problema A-3-3 

Considere la función 


e7" 


xi) = =— 


Muestre que s = 0 no es un polo de X(s). Muestre también que 


er 


1 > 
Y(s5 = —=— 
(s) z 
tiene un polo simple en s = 0. 


Solución Si la función de transferencia incluye un término trascendente e”, entonces éste se puede 
reemplazar mediante una serie válida en la vecindad del polo en cuestión. 
Para la función 


er 


X(s) = == (3-79) 


se obtendrá la expansión en series de Laurent alrededor del polo en el origen. Puesto que, en la vecindad del 
origen, e”* se puede reemplazar por 
TS? (TY 
emir EL. (3-80) 


al sustituir la ecuación (3-80) en la ecuación (3-79) obtenemos el resultado 


19m GE, BP... 


2 3-2: 
-r-Is, TS 
2! 3! 
que es la expansión en series de Laurent de X(s). A partir de esta última ecuación se ve que s = 0 no es un 
polo de X(s). 
Ahora, considere Y(s). Puesto que 


e Ts 


1 = 
Y(s) = —=— 
== 
ésta se puede expandir en series de Laurent como 


T Ts 
TES 


T 
Y ER a ra 
(5) == 
Se ve que el polo en el origen (s = 0) es de orden 1, o es un polo simple. 
Problema A-3-4 


Muestre que la transformada de Laplace del producto de dos funciones f(t) y g(t), de las cuales se garantiza 
que la transformada de Laplace existe, puede estar dada por 
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HOO = ¿EL FGG — p)dp 


Solución La transformada de Laplace del producto de f(+) y g(t) está dada mediante 


HOROI = | 10800 dt 


Observe que la integral de inversión es 


1 crja 


f9) = ds F(s)e”ds, t>0 


donde c es la abscisa de convergencia para F(s). De este modo, 


HAO = zl, [Fdo 


Capítulo 3 


(3-81) 


(3-82) 


Debido a la convergencia uniforme de las integrales consideradas, se puede invertir el orden de integración: 


LEO = = F(p) dp f goes dt 


Si observamos que 


Í 2g(0e Pdt = G(s — p) 
o 
obtenemos 


c+ja 


HOOI =>)" FGG - p)dp 
2r jej 


Problema A-3-5 


Muestre que la transformada de Laplace de 


æ 


x(0) = E a(l — KT) = x(t) X 94 — KT) 


k=0 


puede estar dada por 


xo = sfo E, sa — kn] 
f XD) 


E 27 ca 


Solución Refiriéndose a la ecuación (3-83), rescrita como 
2a | DN e 
NOS) = zz). FOPO = p)dp 
donde 
fO = x(t) y g(t) = Y êl — kT) 
k=0 


y observando que 


PJS —kT)] =e 0" 
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se tiene 
d5 ôlt — «n| =]+e +e nye Tp. =e 
k=0 l-e 
Puesto que 
G(s) = d5 a= en] Jed 

k=0 l-e 

se tiene 
E 1 
Glis =P)= 755 

Observe que los polos de 1/[1 —e”"=] se pueden obtener al resolver la ecuación 

1-e eN =o 
O 


-T(s — p) = :j2mk, k=0,1,2,... 


de modo que los polas son 
p =s + j Ek = s + jurk, k=0,1,2,... 


donde w, =27r/T. De esta manera, existe una infinidad de polos simples a lo largo de una línea paralela al eje 
ja. 
La transformada de Laplace de x*(r) ahora se puede escribir como 


X*(s) = shko y alt — en) 


OE id 1 

= Tril Pr em (3-86) 
donde la integración es a lo largo de una línea desde c — j% hasta c + jœ paralela al eje imaginario en el plano 
p. separa los polos de X(p) de los polos de 1/[1 —e"“="*], La ecuación (3-86) es la integral de convolución. 
Es un hecho bien conocido que dicha integral se puede evaluar en términos de los residuos mediante un 
contorno cerrado que consista de una línea desde c — jæ hasta c + jæ y un semicírculo de radio infinito en 
el semiplano izquierdo o derecho, dado que la integral a lo largo del círculo que se añadió es una constante 
(ya sea cero o distinta de cero). Existen dos formas de evaluar esta integral (una utilizando un semicírculo 
infinito en el semiplano izquierdo y otra con un semicírculo infinito en el semiplano derecho); se conside- 
rarán estos dos casos por separado en los problemas A-3-6 y A-3-7. 


Problema A-3-6 
Refiriéndose a la ecuación (3-86), rescrita como 


Loe 1 
* = — xq_ A—— 
X*(s) 27 jJ.-yo Xp); TT 
muestre que, al realizar la integración en el semiplano izquierdo. X'(s) puede estar dada por 
; (p) 
X*(s) = » | residuo de E en el polo de X(p) (3-87) 
=e 
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Al sustituir z por e” en la ecuación (3-87), se tiene 


)z 





z-e” 


l X(p 
X(z) = Y, | residuo de en el polo de X(p) 


Al cambiar la notación de la variable compleja de p a s, se obtiene 





[ , X(s)z 1 
X(z) = Y [modig de 7 en el polo de Z 
A A 
Z AA al PAEO 
SS 2 a z ping le si) E z] 





donde se supone que X(z) tiene A diferentes polos múltiples y m — h polos simples (m > h). Se supone que 
los polos de X(s) están en el semiplano izquierdo y que X(s) se puede expresar como el cociente de 
polinomios en s, o 


q(s) 
MAS ps) 
donde g(s) y p(s) son polinomios en s. También se supone que p(s) es de mayor grado en s que g(s), lo cual 
significa que 
lim X(s)=0 


Solución Se evaluará la integral de convolución dada por la ecuación (3-86) mediante un contorno 
cerrado en el semiplano izquierdo del plano p, como se muestra en la figura 3-52. Utilizando este contor- 
no cerrado, la ecuación (3-86) se puede escribir como 
x= 1 x end 
2] deja 1-0 
1 X(p) 1 X(p) 

m CT T E k or TG d 3- 

2rj11-e 70 P 2mjlril = ee (9588) 
donde el contorno cerrado consiste en una línea desde c — joo hasta c + joo y T, que, a su vez, consiste en 
un semicírculo de radio infinito y las líneas horizontales en joo y —joo, mismas que conectan la línea desde 
c -jæ hasta c + jœ con el semicírculo en el semiplano izquierdo del plano p. Se elige un valor de c tal que 
todos los polos de X(p) estén a la izquierda de la línea desde c — joo hasta c + jæ y todos los polos de 1/[1 
—e "=P estén a la derecha de esta línea. El contorno cerrado encierra a todos los polos de X(p), mientras 
que los polos de 1/[1 — e 7*=?] están fuera del contorno cerrado. 

Debido a que se ha supuesto que el denominador de X(s) es de orden mayor en s que el numerador, 
la integral a lo largo de IT, (el semicírculo infinito en el semiplano izquierdo más las líneas horizontales en 
je y jo, las cuales conectan a la línea desde c ~j% hasta c + ¡oo con el semicírculo) se desvanece. Por tanto, 
1 X(p) 
X*(s) = rj] 1 e OP 

Esta integral es igual a la suma de los residuos de X(p) en el contorno cerrado. (Refiérase al apéndice B para 
el teorema del residuo.) Por tanto, 


X 
Xx*(s) = Y [residuo de e en el polo de x)| (3-89) 


www.FreeLibros.me 


Capítulo 3 Problemas de ejemplo y soluciones 145 






x 






—— x 
Polos de 
Xip) x 
x 
x 
x 
Eo 


1 


Polos de ——_—__—_— 
es t- Tls-0l 


Figura 3-52 Contorno cerrado en el semiplano izquierdo del plano p. 


Al sustituir e” por z en la ecuación (3-89), se tiene 





Xx) = Y [reino de ma en el polo de xo) 


Al cambiar la notación de la variable compleja de p a s, se obtiene 





y X 
Xz)= 5 | residuo de F 2a en el polo de x» (3-90) 


Suponga que X(s) tiene polos s,, 5», ... ., Sa. Si un polo en s = s, es un polo simple, entonces el residuo 
K, correspondiente es 





; X(s)z 
K; = lim [e -= s) ( a (3-91) 

s>sj ze 

Si un polo en s = s, es un polo múltiple de orden n, entonces el residuo K, es 
1 di  X(s)z 

== ———— lim == | (s — s)" 3-92 
K: (ni pea yag s) z— ers ( ) 
Por tanto, si X(s) tiene un polo múltiple s, de orden »,, un polo múltiple s, de orden n, .... un polo 
múltiple s, de orden n, y polos simples Sp 1, Spyz oa Sm entonces X(=) dada por la ecuación (3-90) se 


puede escribir como 





X(s)z ; 
X(z)= E | resiou de E 1 E en el polo dex | 
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h se 
nč i n X(s)z 
OE (ni — pin m g El a sy" pe 
: X(s)z 
+ 5 lim [e -= s;) ( a (3-93) 
j=h+15>j o -i 
donde n, es el orden del polo múltiple en s = s,. 
Problema A-3-7 
Refiriéndose a la ecuación (3-86), rescrita como 
LA E 
* = — 
X (5) 27] c-jo 1 pue e TEP) dp 


muestre que al realizar esta integración en el semiplano derecho del plano p, X(s) puede estar dada por 


X*(s) = DEL Pak (3-94) 


siempre y cuando el denominador de X(s) sea de grado dos o mayor en s que el grado del numerador. 
Muestre que si el denominador de X(s) es sólo un grado mayor en s que el grado del numerador entonces 


X*(s)=+ LS X(s + jo,k) + 5x(0+) (3-95) 


Teacs 


Solución Evalúese la integral de convolución dada por la ecuación (3-86) en el semiplano derecho del 
plano p. Elíjase el contorno cerrado que se muestra en la figura 3-53, el cual consiste en una línea desde 
c— jo hasta c + jæ y Ip, la porción de un semicírculo de radio infinito en el semiplano derecho del plano p 
que está a la derecha de esta línea. El contorno cerrado encierra a todos los polos de 1/[1 —e""*=9], pero no 
encierra a ninguno de los polos de X(p). Ahora X (s) se puede escribir como 


1 (Xp) 
A era 

-14 AX) y LL X 

ETT e70 2 Jr21 — TP Gan 


Se investigará la integral a lo largo de I}, la porción del semicírculo infinito a la derecha de la linea 
desde c-j% hasta c + jæ. Puesto que una infinidad de polos de 1/[1—e"*”] están sobre una línea paralela 
al eje jw, la evaluación de la integral a lo largo de Fp no es tan sencilla como en el caso anterior, donde el 
contorno cerrado encierra un número finito de polos de X(p) en el semiplano izquierdo del plano p. 

En la mayoría de los sistemas de control reales, a medida que s tiende a ser más grande, X(s) tiende 
a cero por lo menos tan rápido como l/s. Por tanto, a continuación se consideran dos casos, uno donde el 
denominador de X(s) es de dos grados o más en s que el grado del numerador y otro donde el denominador 
de X(s) es de un grado mayor en s que el grado del numerador. 


Caso 1: X(s) Posee por lo menos dos polos más que ceros. Con referencia a la teoría de la variable 
compleja, se puede mostrar que la integral a lo largo de T; es cero si el grado del denominador p(s) de X(s) 
es mayor por lo menos en 2 que el grado del numerador g(s); esto es, si X(s) posee por lo menos dos polos 
más que ceros, lo cual implica que 


limsX(s) = x(0+) = 0 
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Im 


Plano p 





1 


Polos de Pr TT 


Figura 3-53 Contorno cerrado en el semíplano derecho del plano p. 


entonces la integral a lo largo de F, es cero. De este modo. en este caso 


EY X(p) 


A TAPAN 
Por tanto, la ecuación (3-96) se simplifica a 
1 X(p) 
X*(s) = rj Ie rem aP (3-97) 


La integral a lo largo del contorno cerrado dada por la ecuación (3-97) se puede obtener mediante la 
evaluación de los residuos en el número infinito de polos en p = s + jw, k. De este modo. 


E A ; Xi 
X*(6s)=- 2 | lim ft» at ja 2) 
k=-w | p>s+jwsk 1 e 
El signo menos al principio del segundo miembro de esta última ecuación viene del hecho de que en la 
integración a lo largo de un contorno, la trayectoria F, se toma en la dirección de las manecillas del reloj. Al 
emplear la regla de L'Hópital, se obtiene 
S XI 
X* (s) ES 5 F (p) 
ÓN — p Tp) 
ETA 


P=S+jwsKk 
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Nótese que 
d Tp) = To TP) = _ToiTesk > _ToRTK n 
p! -e P) pas+jur = Te 2 PENT Te Te T 
se tiene 
© X(p) 
* A NE 
e TA 
o 
ls 
X*(s) = 7,2 X(s + jo,k) (3-98) 
De este modo, 
1 < a 
X(2) = 7,2 X6 Ham (3-99) 


Observe que esta expresión de la transformada z es útil para probar el teorema de muestreo (véase la 
sección 3-4). Sin embargo, es muy tedioso obtener las expresiones de la transformada de funciones 
comúnmente encontradas mediante este método. 


Caso 2: X(s) tiene un denominador de un grado mayor en s que el grado del numerador Para este caso. 
lim, sA(s) =x(0+) + 0 < x y la integral a lo largo Tp no es cero. [El valor distinto de cero está asociado 
con el valor inicial x(0+) de x(t).] Se puede mostrar que la contribución de la integral a lo largo de F, en la 
ecuación (3-96) es -4x(0+). Esto es, 








1 x(p) 1 
5x(0+ 
Imini ce o P =ar) 
Entonces el término integral en el segundo miembro de la ecuación (3-96) se convierte en 
(q)=15y ; 1 
X*(s)= 7,2 X (s + jo,k) + ¿*(0+) (3-100) 
Problema A-3-8 
Considere la función 
Jer”, t20 
x9) = fe t<0 


Obtenga X(z) mediante la integral de convolución en el semiplano derecho. 


Solución La transformada de Laplace de x(t) es 


1 
X(s) = — 
(s) s+a 
Es claro que lim,» sX(s) =x(0+)= 1, o que la función tiene un salto discontinuo en =0. Por tanto se debe 
utilizar la ecuación (3-95). Con referencia a esta ecuación, se tiene 


i 1 
X*(s)= > Y X(s + jo,k) + ¿:(0+) 
ks x» 


x 


= i3 [X(s + jo,k) + X(s — jo, k)] + xo} +5 
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E A A E 

TlinXAs + josk +a er +3 

_1l 2(s + a) 1 1 

E èz +0 +(0k) s Ek t3 

1] & 2s+aJo, w, 1 

AC a (3-101) 

+k? 
ws 


Con referencia a una fórmula disponible en las tablas matemáticas, 


` x 1 1+ e°?™ 


AA+ k x l-e?” 
y Observando que 


s+a 





27 = T(s + a) 


ws 
se puede rescribir la ecuación (3-101) en la forma 
AR Ae DE 
rie ea"? 


1140 70D +] go 7 
=> I2 e T6+a) 


P (s) = ¿22 


2 
1 2 
SAVER 


1 


1 _ ec Tn 


X(2) = 
De este modo, se ha obtenido X(z) mediante la integral de convolución en el semiplano derecho. [Este 
proceso para obtener la transformada z es muy tedioso debido a que está involucrada una serie infinita de 


X(s + jw, k). Este ejemplo se presenta sólo con propósitos de demostración. Se deben utilizar otros 
métodos para obtener la transformada z. ] 


Problema A-3-9 
Obtenga la transformada z de 


A ES 
(s + 1YUs + 2) 


empleando 1) el método de la expansión en fracciones parciales y 2) el método de los residuos. 


X(s) = 


Solución 
1. Método de la expansión en fracciones parciales. Puesto que X(s) se puede expandir en la forma 
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se tiene 





1 TeTz"' 1 
JE a - 1) (1-e 2 y a - La) 
OIE A Y JE A 2 
ES G E eTzy 1 - eg 
2. Método de los residuos. Refiriéndose a la ecuación (3-93) y observando que X(s) tiene un polo 


doble en s =-—1 y un polo simple en s = 2, se tiene 


1 >. d 2 $ z 
XO as |e EGODE = 


$ s Z 
mm le wa (s + 145 +2) z — | 














22? — 2ze * — Tze" 2z 
(z -eY ze" 
2-2e 2 ~! — Te "2 2 
A Ea 


Problema A-3-10 
Considere una señal en tiempo continuo x(£) con un espectro en frecuencia limitado entre ~w; y w. Esto es. 


Au) = 0, para w<-wy0/<0 


Pruebe que si esta señal se muestrea con una frecuencia w, > 2w, entonces la transformada de Fourier de x(t) 
se determina en forma única porx(k7), k=...,-2,-1,0,1,2,..., y la señal en tiempo continuo original 
x(t) puede estar dada por la suma de una serie infinita de muestras de valores ponderados x(k7) como sigue: 
E sen [w(t — kT)/2] 
= y A e A 
a) = LAO mn 


(Éste es el teorema de muestreo de Shannon.) 


Solución La transformada de Fourier de x(t) está dada por 


x 


X (jæ) = emo) dt 


y la transformada inversa de Fourier está dada por 


11 
x(t) = Ef exo) da 
Defina la versión muestreada de x (t) como x*(t). Entonces x*(t) puede estar dada por 


Ub) = + x(- T) + T) + x(0)5(0) + xT- T) + +. 


w 


= Y x(kT)ó(t — kT) 


k=-> 


La transformada de Fourier de x*(t) es 


- x 


X*(jw) al e x*(t)dt = Í e| > x(kT)5(t — ema 
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x 


= ARTETA 


k=-x 


Así. A'(¡w) está determinada en forma única porx(X7).k=....-2.-1,0.1,2, 
Refiriéndose a la ecuación (3-27). la transformada de Fourier de x*(£) puede estar dada por 


X*(jw) = EEx jw + ja, k) 
Debido a que el espectro en frecuencia de la señal en tiempo continuo original x(1) está limitada entre —w, 
y w. Se tiene 
XAGw)=0, para w < =w, y w; < w 
Debido a que la frecuencia de muestreo w, es mayor que 2w, se tiene 
X(w)=0. para w <-t, y +w,< w 


Por tanto. 


X*(jo) =p + X(jo + jas) + Xljw) + X(io — jus) +] 


= 5X(ja) 
De este modo. se obtiene 


o] TX * (jo), lla Sw sio, 
Kio) = (4, w < iw, jw <w 


La transformada inversa de Fourier de X(¿w) da como resultado 


x(t) = 5 Fox do 


Tar. 
=>]  e”X*(ju)dw 
27 — wg/2 
1 o2 he . 
=> el Y xk TD) 97 | dw 
Ws 2 —cog/2 k=-x 


LÈ a2 
== Y x(kT) Í a-d dw 





Ws k=-2 ~wsl2 
æ eD uy 
O a 


sin [w(t — kT)/2] 
= 2 x(kT) w(t — kKT)/2 


k=-x 


Por tanto, se ha mostrado que la señal en tiempo continuo original x(£) se puede reconstruir a partir de los 
datos muestreados x(47). [Observe que a menos que X(¡w) =0 para w < -w y w, < w la señal en tiempo 
continuo x(£) no se puede determinar a partir de los datos muestreados (47). k=....—2.-1.0,1.2....]. 


Problema A-3-11 
Dibuje las curvas de magnitud y fase para el retenedor de primer orden. Luego compare las características 
de magnitud y fase del retenedor de primer orden con las del retenedor de orden cero. 


Solución La función de transferencia del retenedor de primer orden es 
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Ts +1(1-e PY 
ao EA) 





Al sustituir s por jœ en G, (s), se obtiene 


Tjo +1[1=e PY 
ame 
A a PA tés, iy 2 
- Jo + Nc qe dio | 
T jo 
Tjo+1 nla sen o 
= —— e a 
T jw 
Tjw +1 _,7,4sen”(Tw/2) 
= ~ e A 
T w 


Por lo tanto, 


[Gn(ja)|= vr ea] 


Tw/2 


¿Gulje) =/Tjo + 1+ 077 


tan Tow — Tw 





1) 


p 270 2710 
ws ws 


donde se ha utilizado la relación 7=2711/0,. 
En algunos valores seleccionados de w, se tiene 


IGm(j0)| = T Gm(j0) = 0° 
T a 
6.7) = 1.3367 aniz) = -107.7 
2 2 > 
lae =0 /cliz) = 279.0 


Capítulo 3 


En la figura 3-54 se muestran las gráficas de las características de magnitud y fase del retenedor de primer 
orden y las correspondientes para el retenedor de orden cero. A partir de la figura 3-54 se observa que tanto 
el retenedor de primer orden como el retenedor de orden cero no son filtros paso-bajas muy satisfactorios. 
Éstos permiten una transmisión significativa arriba de la frecuencia de Nyquist wy = "n/T. Es importante. 
por tanto, que la señal sea filtrada con un filtro paso-bajas antes de la operación de muestreo de modo que 


las componentes de frecuencia mayores a la frecuencia de Nyquist sean despreciables. 


Problema A-3-12 


Considere el retenedor de orden cero que se muestra en la figura 3-55. A partir del diagrama se tiene 


Ye) = 66004). Ls -e x*() 


Muestre que 


Y*(s) = X*(s) 


Solución Si tomamos la transformada de Laplace asterisco de la ecuación (3-102), se tiene 


_ p -Ts\* 
Y*(5) = (=) x*(s) 
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t Gr) | 


| Grot/w) | 





3 
E 
10 
2 
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2 
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$ 
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£ 360 


4507 


540" 





Figura 3-54 Características de magnitud y fase del retenedor de primer orden 
y las correspondientes al retenedor de orden cero. 


En términos de la notación de la transformada z, se tiene 
-Ts 


Y(2) -z| — hko 





donde 
le” = (1 - -97/1 A E E 
s B $ 5 l1=z* 


Figura 3-55 Retenedor de orden cero. 
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Por tanto 
Y(2) = X(2) 
En términos de la notación de la transformada de Laplace asterisco, esta última ecuación se puede escribir 
como 
Y*(s) = X*(s) 


Problema A-3-13 
Obtenga la secuencia de ponderación del sistema definido por 


1 


ADS ay 


para n= 1, 2 y 3, respectivamente. 


Solución Para n= 1, se tiene 














1 -1 2,-2 E 
= =1- + - q ho... 
Gi(2) iFa” 1 — az a? z az 
Por tanto, se encuentra que la secuencia de ponderación g,(k) es 
gi(k) = (~a) 
Para n = 2, se obtiene 
1 E A A 
cie e az a 2a z 
(1 + az") 1 + az 
=1- 2az™! + 38 z? — 4a z>? +. 
Por tanto, la secuencia de ponderación g,(K) es 
galk) = (k + 1)(-a) 
Para n= 3, se tiene 
1 1-2a2 + 3042 ?*-dad27 ++... 


Gx(2) (1 +az "y 1 + az" 


= 1 — 3az* + 6a?z™? — 100427? +- 
Por tanto, la secuencia de ponderación g,(k) es 


ENS (k + ze + D ay 





Problema A-3-14 
Obtenga la salida en tiempo discreto C(z) del sistema de control en lazo cerrado que se muestra en la figura 
3-56. También obtenga la salida en tiempo continuo C(s). 


Figura 3-56 Sistema de 
control en tiempo discreto. 
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Solución A partir del diagrama se tiene 
C(s) = GAs)M*(s) 
M(s) = Gi(s)E(s) 
Els) = R(s) ~ H(s)C(s) 
Por tanto. 
M(s) = Gi(s)[R(s) — H(s)C(s)] 
= Gi(s)R(s) — Gi(s)H(s)G:(s)M* (s) 


Al tomar la transformada de Laplace asterisco de esta última ecuación, se obtiene 
M* (s) = [G: R(s)}* — [G: G2 H(s)]*M* (s) 


o 
PE PETREA CLL SIR 
MO = TFG CHEF 
Puesto que C(s) = GAs)A1*(s). se tiene 
GH) [G RO 


En términos de la notación de la transformada z, 
G2(z2)}G, R(z 
cu Az)G:R(2) 
1+ G,G>,H(z) 
Esta última ecuación da la salida en tiempo discreto C(=). 
La salida en tiempo continuo C(s) se puede obtener a partir de la siguiente ecuación 
[G, R(s))* 
1 + [G, G,H(s))* 
Note que [G¡R(s)/£1 + [G,G,H(s)]') es una serie de impulsos. La salida en tiempo continuo C(s} es la 


respuesta de G(s) a la secuencia de dichos impulsos. [Véase el problema A-3-18 para los detalles de cómo 
determinar la salida en tiempo continuo c(£), la transformada inversa de Laplace de C(s).] 


C(s) = GAs)M*(s) = GAs) 


Problema A-3-15 
Considere el sistema que se muestra en la figura 3-57. Obtenga la función de transferencia pulso en lazo 
cerrado C(z)/R(=). También obtenga la expresión para C(s). 





Figura 3-57 Sistema de control en tiempo discreto. 
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Solución A partir del diagrama se tiene 
C(s) = Ga(s)M*(s) 
M(s) = Gr(s)E*(s) 
E(s) = R(s) - H(s)C(s) = R(s) — H(s)GAs)M*(s) 


Si tomamos la transformada de Laplace asterisco en ambos miembros de las últimas tres ecuaciones. 
obtenemos 


C* (s) = G3 (s)M* (s) 
M* (s) = G7(s)E* (s) 
E* (s) = R* (s) - HGł(s)M* (s) 
Al resolver para C'(s) tenemos que 
C*(s) = GHs)GHS)[R*(s) — HG2(s)M*(s)] 


C*(s) = GY(s)Gž(s)R* (s) — Gł(s)Gł(s)HGž(s)M* (s) 
= Gř(s)Gł}(s)R* (s) — GUS) HG (S)C*(s) 
De este modo, 
C*(s)[1 + G¥(s)HGž(s)}] = Gř(s)Gł(s)R* (s) 


C*(s)_  Gi(s)Gz(s) 
R*(s) 1+ G(s)HG%(s) 





En términos de la notación de la transformada z, se tiene 
C(2) _ _ Gi(2)Gaz) 
R(z) 1+ Gi(z)HG2(2}) 
La salida en tiempo continuo C(s) se puede obtener a partir de la siguiente ecuación: 
Gi(s)R*(s) 


C(s) = GAs)M*(s) = CATE GHGIG) 


Problema A-3-16 


Considere el controlador PID analógico y el controlador PID digital. La ecuación para el controlador PID 
analógico es 





m(t) = K|e0 + 1f e(t) dt + n0] 


donde e(ż) es la entrada al controlador y m(t) es la salida del controlador. La función de transferencia del 
controlador PID analógico es 


M6) _ 1 
= =K11+ 5 +7T. 
Gís )= Els ) Ts as 
La función de transferencia pulso del controlador PID digital en la forma posicional está dada por la 
ecuación (3-56): 
K; 


Gpíz) = TO = Kp + 7 + Kp(1 - 27?) 





donde E KK p 
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Compare las gráficas polares (características de respuesta en frecuencia) del controlador PID analógico 
con las correspondientes al controlador PID digital. 


Solución Para el controlador PID analógico, las características de respuesta en frecuencia se pueden 
obtener mediante la sustitución de jw en lugar de s en G(s). De este modo, 


; 1 ; 
G(jw) = x(: + Tjo + Tajo) 


: K(i -jz + Taju) (3-103) 


Para el controlador PID digital, las características de respuesta en frecuencia se pueden obtener 
mediante la sustitución de z = e" en G(z): 


-jwT 


Gole”) = Kp + TS + Kp(l — e) 


Kı 
= Kp + ——— + z y 
E 1 —coswT + jsen WT Ko(1 cos wT + j sen wT) 


Kı . sen wT 
= Kp + — — Ez IIIT>— 
ó ( ITZ coswT 


7 ) + Kp(1 — coswT + j senwT) (3-104) 


Se comparará primero por separado la acción P. la acción / y la acción D del controlador analógico 
con sus contrapartes en el controlador digital. Observe que en la acción proporcional (acción P) el controlador 
digital tiene una ganancia de K, /2 menor que la ganancia correspondiente en el controlador analógico. 
puesto que K, =K- 4 K,. Véase la figura 3-58a). 

Para la acción integral (acción /) las partes reales de las gráficas polares del controlador analógico y 
del controlador digital difieren por K, /2. como se muestra en la figura 3-586). 

Cuando las acciones proporcional e integral se combinan, entonces las partes reales de las gráficas 
polares para la acción P/ analógica y la acción P/ digital se hacen iguales, como se muestra en la figura 3-580). 

Las gráficas polares de la acción derivativa (acción D) para el controlador analógico y para el 
controlador digital difieren mucho, como se muestra en la figura 3-58d). Por tanto, existen diferencias 
considerables entre la acción D analógica y la acción D digital. 

La gráfica polar cualitativa del controlador PID analógico se puede obtener a partir de la ecuación 
(3-103) variando w desde 0 hasta æ, como se muestra en la figura 3-59a). De modo similar. la gráfica polar 
cualitativa del controlador PID digital se puede obtener a partir de la ecuación (3-104) variando w desde 0 
hasta 7/7, como se muestra en la figura 3-59b). 

Observe que, aunque las gráficas polares del controlador PI analógico y del controlador Pl digital 
son similares, existen diferencias significativas entre las gráficas polares del controlador PID analógico y el 
controlador PID digital. 


Problema A-3-17 
En la sección 3-5 se obtuvo la función de transferencia pulso para el controlador PID en la forma 
posicional. Con referencia a la figura 3-28, la función de transferencia pulso para el controlador PID digital 
se obtuvo como 


M(z) Kı i 
= —— = + ——— + Kol- 
Gn(2) E(z) E 120 
Utilizando Vm(kT) = m(kT) — m((k — 1)T) obtenga la ecuación del controlador PID en la forma de 


velocidad. 
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Im Im 
1 
(Kp=K- 3 Kp 

K Kp 

a) 
0 Re 0 Re 
. Acción Panalógica Acción P digital 

b) 
c) 

Acción Pl analógica Acción PI digital 
d) 





Acción Danalógica Acción Ddigital 


Figura 3-58 Gráficas polares de los controladores analógico y digital con a) acción 
proporcional; b) acción integral; c) acción proporcional más integral, y d) acción derivativa. 
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Controlador PID analógico Controlador PID digital 


al b) 


Figura 3-59 a) Gráfica polar del controlador PID analógico: b) gráfica polar del controlador PID digital. 


Solución Observe que 


Vm(kT) = m(kT) - m((k — 1)T) 


= klean - e((k - 1)T) + F felkT) + e((k — 197) 


+Lioxr) — 2e((k — 1)T) + e((k — an} 


= Kp[eAkT) — e((k — DT)] + Kje(kT) 
+ Kole(kT) — 2e((k — 1)T) + e((k — 2)7)) (3-105) 
donde se han empleado las relaciones Kp = K — 1K. K¡=KTIT,. y Kp = KT /T. (Para estas relaciones. 
refiérase a la obtención de la forma posicional de la ecuación de control del PID digital.) La ecuación (3-105) 


toma en consideración la variación de la forma posicional en un período de muestreo. 
Suponga que el error actuante e(k7) es la diferencia entre la entrada :(47) y la salida (47). o 


e(kT) = r(kT) — c(kT) 


Al sustituir esta última ecuación en la ecuación (3-105), se obtiene 


Vm(kT) = Ko[r(kT) — r((k — 1)T) - (KT) + cU(k - DT) 
+ Ki[r(kT) — AKT)] + Ko[r (KT) — 2r((k — DT) 
+ r((k — DT) =- (KT) + 2c((k — DT) — c((k — DT) (3-106) 
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El esquema de control PID en la forma de velocidad dado por la ecuación (3-106) se puede modificar de 
algún modo en una forma diferente para hacer frente a grandes cambios súbitos en el punto de ajuste. 
Puesto que las acciones de control proporcional y derivativo producen grandes cambios en la salida del 
controlador cuando la señal que entra a éste presenta un cambio súbito grande, para suprimir dichos 
cambios en la salida del controlador, los términos proporcional y derivativo digitales se pueden modificar 
como se discute a continuación. 

Si los cambios en el punto de ajuste [entrada -(k7)] son una serie de cambios de tipo escalón, entonces 
inmediatamente después de que un cambio escalón tiene lugar, la entrada r(X7) permanece constante por un 
tiempo hasta que el siguiente cambio escalón tiene lugar. Por tanto, en la ecuación (3-106) se supone que 


r(kT) = r((k — 1)T) = r((k — 2)T) 
(Observe que esto es cierto si la entrada permanece constante. Pero se supone que esto sigue siendo cierto 
aun si un cambio escalón tiene lugar.) Entonces la ecuación (3-106) se puede modificar a 
Vm(kT) = —Kp[c(kT) — c((k — 1)T)] + Ki[r(kT) — c(kT)] 
— Kp[c(kT) — 2c((k — 19T) + c((k — 2)T)] (3-107) 


La transformada z de la ecuación (3-107) da como resultado 
(1 - 27 M(2) = -Kr(1 — 27 )C(2) + K[R(2) — C(z)] 
- Kp(1- 227? + z °)C(z) 
Al simplificar, se obtiene 


R(z) - C(2) 


M(2) = -Kr C(z) + K 737 — Koll - 279C(2) (3-108) 


La ecuación (3-108) da el esquema de control PID en la forma de velocidad. El diagrama de bloques de la 
realización del esquema de control PID digital en la forma de velocidad se mostró en la figura 3-30. 


Problema A-3-18 
Considere el sistema que se muestra en la figura 3-60a). Obtenga la salida en tiempo continuo c(t) de modo 
que se pueda determinar la salida entre dos instantes cualesquiera de muestreo consecutivos. Encuentre la 
expresión para la salida en tiempo continuo c(£). El período de muestreo Tes de 1 segundo. 


Solución Para el sistema que se muestra en la figura 3-60a), se tiene 
C(s) = G(s)E*(s) 
E(s) = R(s) — C(s) 


Por lo tanto, 
E*(s) = R*(s) — C*(s) = R*(s) — G*(s)E*(s) 

o 

en RC) 

E= 1 + G*(s) 
De este modo, 
R* 
CO = COTES 


La salida en tiempo continuo c(£) se puede por tanto obtener como la transformada inversa de Laplace de C(s): 
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pam E 
sis+1) 





a) 


Respuestas al imputso individuales 





6 Puntos de salida que se obtienen 
mediante el cálculo de las muestras 





1.0 


0.5 


c) 


Figura 3-60 a) Sistema de control en tiempo discreto: b) gráficas de las respuestas al 
impulso individuales; c) gráfica de la salida en tiempo continuo c(£) contra 7. 


R*(s) | 


c(t) = £”[C(s)] = TOA 


Para este sistema. 


le” 1 
AD 
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Por tanto, 
ia gu =E s(s A 11 ro] 
Definase 
X*(s) = (1 - ts 


Entonces la expresión de la transformada z para esta última ecuación es 





-n RQ) 
Mor INS 
OU GG 
Con referencia a la ecuación (3-58) para la transformada z de G(s), se obtiene 
1 
1-2" 
an pá -1 E 
NI ESE F 0.36797 + 0.26422 > 


(1 — 0.3679 (1 — z`’) 
_ 1-1.36797* + 0,3679z ? 
o 1=zZ*+0.6321z* 

Por tanto, al observar que el período de muestreo T es 1 segundo o T= 1, se tiene 


1 — 1.3679e * + 0.3679e > 


* = 
X*(s) 1-e*+0.6321e * 


Por lo tanto, 


1 1-1.3679e* + paset 


E —1 
S l +1) 1-€* + 0.6321 7 


=% “L i — 0.3679e * — 0.6321e7™ — 0.3996e7™ 
ss +1) 
+ 0e7*% + 0,2526e* + 0.2526e7® + 2] 


Puesto que 


1 
s+1 


s+D S 


la transformada inversa de Laplace de esta última ecuación es 


1 
i A A pe 
Y [| t=1+e 
Por tanto, se obtiene 


c(t) = (t — 1 + e™) — 0.3679[(1 - 1) -1+e “tr -1) 
—0.6321[(€ — 2) - 1 + e “?]1(t — 2) 
— 0.3996[(£ — 3) - 1 + e" “"]1(r — 3) 
+ 0.0000[(+ — 4) — 1 + e “"9]1(r — 4) 
+0.2526[(1 — 5) - 1 + e Ct — 5) 
+ 0.2526[(t+ — 6) - 1 + e “"9]1(r — 6) 
pad (3-109) 





1 1 1 
iS 
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En la figura 3-605) se muestran las gráficas de las respuestas impulso individuales dadas por la ecuación 
(3-109). [Observe que c(t) consiste en la suma de respuestas impulso que se presentan en/=0.1=1,1= 
2....con factores 1. -0.3679, -0.6321..... 1 

A partir de la ecuación (3-109) se ve que para los intervalos de tiempo 0<1<1,1<1<2,2<f< 
3..... la salida c(t) es la suma de las respuestas impulso como sigue: 


t=1+e*, 0=s1<1 

(t -1 +e™) -0,3679[( - 1) -1+e “== 1) 1st<2 
e(t) =$ (t -1 + e~) — 0.3679[(1 — 1) - 1 + eNe — 1) 

-0.6321[(1 — 2) - 1 + e “Ut — 2), 21<3 


Los cálculos para algunos valores de f son: 
c(0)=0-1+1=0 

c(0.5) = 0.5 — 1 + 0.6065 = 0.1065 

c(1.0) = 0.3679 — 0.3679 x 0 = 0.3679 

c(1.5) = 0.7231 — 0.3679 x 0.1065 = 0,6839 

c(2.0) = 1.1353 — 0.3679 x 0.3679 = 1.0000 

c(2.5) = 1.5821 — 0.3679 x 0.7231 — 0.6321 x 0.1065 = 1.2487 

c(3.0) = 2.0498 — 0.3679 x 1.1353 — 0.6321 x 0.3679 = 1.3996 

c(4.0) = 3.0183 — 0.3679 x 2.0498 — 0.6321 x 1.1353 — 0.3996 x 0.3679 = 1,3996 

c(5.0) = 4.0067 — 0.3679 x 3.0183 — 0.6321 x 2.0498 — 0.3996 x 1.1353 
+0 x 0.3679 = 1.1469 

c(6.0) = 5.0025 — 0.3679 x 4.0067 — 0.6321 x 3.0183 — 0.3996 x 2.0498 
+0 x 1.1353 + 0.2526 x 0.3679 = 0.8944 


La salida en tiempo continuo c(s) obtenida de esta manera se grafica en la figura 3-60c). 


Problema A-3-19 


Considere el filtro digital definido mediante 

Y(2)_ 4 - DQG*+122 +1) 

X(z) (z +0.1)(z” — 0.32 + 0.8) 

Dibuje un diagrama de la realización en serie y un diagrama de la realización en paralelo. (Utilice una sección 
de primer orden y una sección de segundo orden.) 


G(z) = 


Solución Se considerará primero el esquema de la realización en serie. Para limitar los coeficientes a 
cantidades reales, se agrupan los términos de segundo orden del numerador (que tienen ceros complejos) y 
los términos de segundo orden del denominador (que tienen polos complejos). Por lo tanto, G(2} se agrupa 
como sigue: 

2-1 24+12:3+1 
z + 0.12?-0.32+0.8 


zi l-z! 1+i2z'+z*7 
7714012 1 = 0.327 + 0.8277 





G(z)=4 


www.FreeLibros.me 


164 Anólisis en el plano z de sistemas de control en tiempo discreto Capítulo 3 





a) 





46.61905 






4.04762 





b) 


Figura 3-61 Diagrama de bloques de la realización del filtro digital que se consideró en el problema 
A-3-19. a) Realización en serie; b) realización en paralelo. 
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La figura 3-61 4) muestra un diagrama de la realización en serie. 
Ahora. se considerará el esquema de realización en paralelo. La expansión de G(-)/= en fracciones 
parciales da como resultado 
G(z) M2 — 1)(z2? + 1.2z +1) 
z z(z + 0.1)(z7 — 0.3z + 0.8) 
7 155 85 
_ 50 T zz +A 


2 “al 203208 


Entonces G(=) se puede escribir como sigue: 


46.61905 > 7.38095 + 4.047622 7' 
1+0.12? 1-0.32  +0.827? 


La figura 3-61b) muestra el diagrama de la realización en paralelo. 














G(z) = -50 + 


Problema A-3-20 
Una señal en tiempo continuo x(£) que cambia lentamente se muestrea cada T segundos. Suponga que los 
cambios en la señal x(£) son muy lentos comparados con la frecuencia de muestreo. Muestre que en el plano 
z, (1 — YT corresponde a la “diferenciación” justamente como s corresponde a la “diferenciación” en el 
plano s. 


Solución Para una señal x(£) que cambia lentamente. la derivada de x(1) se puede aproximar mediante 


wo = ZO = Lix(kT) — x(k — DT) 


La transformada z de esta ecuación da como resultado 
1 
VE) = FIX) - 2 X2)] = E0 2"X(2) 


a partir de lo cual se obtiene el diagrama de bloques que se muestra en la figura 3-62a). Este diagrama 
corresponde a la diferenciación en el plano s que se muestra en la figura 3-62b). Observe que el diagrama de 
bloques que se muestra en la figura 3-62a) se puede modificar como el que se muestra en la figura 3-63. 
(Para la aproximación de la “integración” en el plano z, véanse los problemas B-3-25 al B-3-27.) 


Xtz) 1 i viz) Xis) Vs) 
7 (1-2) 


a) b) 


Figura 3-62 a) Diagrama de bloques para la “diferenciación” en el plano z: 
b) diagrama de bloques para la “diferenciación” en el plano s. 


Figura 3-63 “Diferenciador” 
aproximado en el plano z. 
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PROBLEMAS 


Problema B-3-1 
Muestre que el circuito que se muestra en la figura 3-64 actúa como un retenedor de orden cero. 





mit) 


R; << R, 


Figura 3-64 Circuito para aproximar un retenedor de orden cero. 


Problema B-3-2 
Considere el circuito que se muestra en la figura 3-65. Obtenga una ecuación en diferencias que describa la 
dinámica del sistema cuando el voltaje de entrada aplicado es una constante seccionalmente continua, o 


e(t) = e(kT), kTst<(k+1)T 


R 


ett) C xit) 





Figura 3-65 Circuito RC. 


(Obtenga primero una ecuación diferencial y luego discretícela para obtener una ecuación en diferencias.) 


Problema B-3-3 
Considere el muestreador mediante impulsos y el retenedor de primer orden que se muestra en la figura 
3-66. Obtenga la función de transferencia del retenedor de primer orden, suponiendo una función rampa 
unitaria como la entrada x(t) al muestreador. 


Problema B-3-4 







Retenedor de 


Í Figura 3-66 Muestreador mediante 
primer orden 


impulsos y retenedor de primer orden. 
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Considere la función de transferencia de un sistema 
s+3 
X(s) = == 
(s) (s + 1D)(s +2) 


Obtenga la función de transferencia pulso mediante dos métodos diferentes. 


Problema B-3-5 
Obtenga la transformada z de 


AR: AT 
+06 + b) 


Emplee el método de los residuos y el método basado en la función de respuesta impulso. 


X(s) = 


Problema B-3-6 
Obtenga la transformada z de 
l-e" 1 
MOLA s (s+aY 
Problema B-3-7 
Considere la ecuación en diferencias de un sistema 
y(k + 1) + 0.5y(k) = x(k) 


donde v(0)= 0. Obtenga la respuesta v(k) cuando la entrada x(k) es una secuencia escalón unitario. También 
obtenga la solución mediante MATLAB. 


Problema B-3-8 
Considere la ecuación en diferencias de un sistema 
y(k + 2) + y(k) = x(k) 


donde v(k) = 0 para k < 0. Obtenga la respuesta v(k) cuando la entrada x(A) es una secuencia escalón 
unitario. También obtenga la solución mediante MATLAB. 


Problema B-3-9 
Obtenga la secuencia de ponderación g(k) del sistema descrito mediante la ecuación en diferencias 


y(k) — ay(k — 1) = x(k), -+1<a<1 


Si dos sistemas descritos mediante esta última ecuación se conectan en serie, ¿cuál es la secuencia de 
ponderación del sistema resultante? 


Problema B-3-10 
Considere el sistema descrito mediante 


y(k) — y(k — 1) + 0.24y(k — 2) = x(k) + x(k — 1) 


donde x(k) es la entrada y y(k) es la salida del sistema. 

Determine la secuencia de ponderación del sistema. Suponiendo que (k) = 0 para k < 0, determine 
la respuesta y(x) cuando la entrada x(k) es una secuencia escalón unitario. También obtenga la solución 
mediante MATLAB. 


Problema B-3-11 
Considere el sistema 
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1- 0.577 
(1 — 0.32 (1 +0.727?) 
Obtenga la respuesta de este sistema a una secuencia de entrada escalón unitario. También obtenga la 
solución mediante MATLAB. 





G(z) = 


Problema B-3-12 
Obtenga la respuesta y(kT) del siguiente sistema: 
Ys) 1 
X) +D?) 
donde x(+) es una función escalón unitario y x*(f) es su versión mucstreada mediante impulsos. Suponga 
que el periodo de muestreo T es 0.1 segundos. 


Problema B-3-13 
Considere el sistema definido mediante 


Y(z) 0.52? + 0.4127z° + 0.1747z — 0.0874 
A AA a a 
U(z) Z 


Mediante la ecuación de convolución 





k 
y(k) = 2 h(k — July) 
js 
obtenga la respuesta y(k) a una secuencia de entrada escalón unitario u(k). 


Problema B-3-14 
Suponga que la señal muestreada X*(s) se aplica a un sistema G(s). Suponga también que la salida de G(s) 
es Ms) y y(0+) = 0, 
Y(s) = G(s)X*(s) 


Empleando la relación 


Y*(s) => È Y(s + jw, k) 


-x 


muestre que 
Y*(s) = G*(s)X*(s) 


Problema B-3-15 
Obtenga la función de transferencia pulso en lazo cerrado del sistema que se muestra en la figura 3-67. 





Figura 3-67 Sistema de control en tiempo discreto. 
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Problema B-3-16 
Obtenga la función de transferencia pulso en lazo cerrado del sistema que se muestra en la figura 3-68. 





Figura 3-68 Sistema de control en tiempo discreto. 


Problema B-3-17 
Considere el sistema de control en tiempo discreto que se muestra en la figura 3-69. Obtenga la salida en 
tiempo discreto C(=) y la salida en tiempo continuo C(s) en términos de la entrada y las funciones de 
transferencia de los bloques. 





Figura 3-69 Sistema de control en tiempo discreto. 


Problema B-3-18 
Considere el sistema de control en tiempo discreto que se muestra en la figura 3-70. OObtenga la secuen- 
cia de salida c(kT) del sistema cuando éste está sujeto a una entrada escalón unitario. Suponga que el 
período de muestreo Tes ! segundo. También obtenga la salida en tiempo continuo c(t). 





Figura 3-70 Sistema de control en tiempo discreto. 
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Problema B-3-19 
Obtenga en forma cerrada la secuencia de respuesta c(k7) del sistema que se muestra en la figura 3-71 
cuando éste está sujeto a una entrada delta de Kronecker r(kx). Suponga que el periodo de muestreo Fes | 
segundo. 





Figura 3-71 Sistema de control en tiempo discreto. 


Problema B-3-20 
Considere el sistema que se muestra en la figura 3-72, Suponiendo que el período de muestreo T es 0.2 
segundos y que la ganancia constante K es unitaria, determine la respuesta c(k7) para k=0, 1,2,3 y 4, 
cuando la entrada r(£) es una función escalón unitario. También determine el valor final c(). 





Figura 3-72 Sistema de control en tiempo discreto. 


Problema B-3-21 
Obtenga la función de transferencia pulso en lazo cerrado C(z)/R(z) del sistema de contro! digital que se 
muestra en la figura 3-30. Suponga que la función de transferencia pulso de la planta es G(z). (Observe que 
el sistema que se muestra en la figura 3-30 es un control PID en la forma de velocidad de la planta.) 


Problema B-3-22 
Suponga que un filtro digital está dado mediante la siguiente ecuación en diferencias: 


y(k) + aiy(k — 1) + a2y(k — 2) = b;x(k) + b2x(k — 1) 


Dibuje los diagramas de bloques para el filtro mediante 1) programación directa, 2) programación estándar 
y 3) programación en escalera. 


Problema B-3-23 
Considere el filtro digital definido mediante 


2+2.22 + 0.22? 
62) = 10427 0.127 * 
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Realice este filtro digital en el esquema en serie, en el esquema en paralelo y en el esquema en escalera, 


Problema B-3-24 
Refiriéndose a la aproximación del diferenciador que se muestra en la figura 3-63, dibuje una gráfica de la 
salida v(k) contra k cuando la entrada x(k) es una secuencia escalón unitario. 


Problema B-3-25 
Considere el sistema que se muestra en la figura 3-73. Muestre que la función de transferencia pulso Y(-)/ 
X(=) está dada por i 





Figura 3-73 Integrador digital sin retardo. 


Suponiendo que v(kT) = 0 para k < 0, muestre que 
y(kT) = T[x(0) + x(T) + + + x(«D)] 


De este modo, la salida y(A7) se aproxima al área formada por la entrada. Por tanto. el sistema actúa como 
un integrador. Debido a que v(0) = 7x(0), la salida aparece tan pronto x(0) entra al sistema. Este integrador 
comúnmente se denomina integrador digital sin retraso. 

Dibuje una gráfica de la salida v(A7) cuando la entrada x(kT) es una secuencia escalón unitario. 


Problema B-3-26 
Considere el sistema que se muestra en la figura 3-74. Muestre que la función de transferencia pulso Y(=)/ 


X(=) está dada por 
Y(z) _ zo ) 
Xx) r| -z7 








Figura 3-74 Integrador digital con retardo. 


Suponiendo que y(£7) = 0 para k < 0, muestre que 


y(kT) = T0) + (7D) += + x((k — DD] 
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La salida v(k7) se aproxima al área formada por la entrada. Puesto que 1(0)=0 y y (D) = Tx(0). la salida 
comienza a aparecer en ż = T. Este integrador se denomina como integrador digital con retraso. 
Dibuje una gráfica de la salida (7) cuando la entrada x(k7) es una secuencia escalón unitario. 


Problema B-3-27 
Considere el sistema que se muestra en la figura 3-75. Muestre que la función de transferencia pulso X(-) 
X(=) está dada por 





1 m En) 
Xy) 2M1=z' l-z” 


Este sistema es una combinación de integradores digitales sin retraso y con retraso. como se presentaron 
en los problemas B-3-25 y B-3-26. respectivamente. 





Figura 3-75 Integrador digital bilineal. 


Suponiendo que y(k7) = 0 para k < 0, obtenga y(kT) en términos de (0), (7D), . . . , (KT). Este 
integrador se denomina integrador digital bilineal. Dibuje una gráfica de la salida y(kT) cuando la entrada 
x(kT) es una secuencia escalón unitario. 
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Diseño de sistemas de 
control en tiempo discreto 
mediante métodos 
convencionales 






DUCCIÓN 


27 ¿s:2 capítulo presentaremos en primer término la correspondencia del plano s con el plano z y a 
-:77 nuación analizaremos la estabilidad de los sistemas de control en lazo cerrado en el plano zZ. 


z - 13.es de una entrada y una salida. El primer método está basado en la técnica del lugar geométrico 
zz 25 raices, y utiliza configuraciones de polos y ceros en el plano z. El segundo está basado en el 
—<:: Zo de respuesta en frecuencia en el plano w. El tercer método es un método analítico en el cual 
r<7:1amos obtener un comportamiento deseado del sistema en lazo cerrado manipulando la función 
z= cransterencia de pulso del controlador digital. 

Desde los años cincuenta han quedado bien establecidas las técnicas de diseño para los siste- 
~ż: Je control en tiempo continuo basados en métodos de transformadas convencionales (los del 
--¿7 geométrico de las raíces y de respuesta en frecuencia). Los métodos de transformadas conven- 
: 172.es son especialmente útiles para el diseño de sistemas de control industrial. De hecho, en el 
7:s:30. muchos sistemas digitales de control industrial fueron diseñados con éxito basándose en 
—+1odos de transformadas convencionales. Tanto la familiaridad con las técnicas del lugar geométrico 
zz łs raices y de respuesta, en frecuencia, como la experiencia obtenida en el diseño de controladores 
¿7 2.0gicos son de gran valor en el diseño de sistemas de control en tiempo discreto. 





Organización del capítulo. En la sección 4-1 presentamos material introductorio. La sec- 
¿174-2 se ocupa de la correspondencia del plano s hacia el plano z. La sección 4-3 analiza el criterio 
tabilidad de Jury para sistemas de control en lazo cerrado en el plano z. La sección 4-4 resume 
23 características de respuesta transitoria y en estado permanente de sistemas de control en tiempo 
z creto. La técnica de diseño basada en el método del lugar geométrico de las raíces se presenta en 
¿ sección 4-5. La sección 4-6 primero analiza el método de respuesta en frecuencia y a continuación 
z-zsenta las técnicas de respuesta en frecuencia mediante la transformada w para diseñar sistemas de 
¿:cirol en tiempo discreto. La sección 4-7 se ocupa de un método de diseño analítico. 


La 
as 
fL 
10 
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4-2 CORRESPONDENCIA ENTRE EL PLANO s Y El PLANO z 


Tanto la estabilidad absoluta como la relativa del sistema de control en lazo cerrado en tiempo 
continuo lineal e invariante con el tiempo quedan determinadas por la localización de los polos en 
lazo cerrado en el plano s. Por ejemplo, los polos complejos en lazo cerrado en el semiplano izquier- 
do del plano s cercanos al eje jw mostrarán un comportamiento oscilatorio, y los polos en lazo 
cerrado sobre el eje real negativo mostrarán decaimiento exponencial. 

En vista de que las variables complejas z y s están relacionadas mediante z = e", la localización 
de los polos y de los ceros en el plano z está relacionada con la localización de los polos y los ceros 
del plano s. Por lo tanto, la estabilidad del sistema en lazo cerrado en tiempo discreto lineal e invariante 
con el tiempo puede determinarse con base en las posiciones de los polos de la función de transferen- 
cia en pulso en lazo cerrado. Debe observarse que el comportamiento dinámico del sistema de con- 
trol en tiempo discreto depende del período de muestreo 7. En función de los polos y los ceros en el 
plano z, sus localizaciones dependen del período de muestreo 7. En otras palabras, un cambio en el 
período de muestreo T modifica las localizaciones de los polos y de los ceros en el plano z y hace que 
el comportamiento de respuesta se modifique. 


Correspondencia del semiplano izquierdo del plano s hacia el plano z. En el diseño de un 
sistema de control en tiempo continuo, la localización de los polos y de los ceros en el plano s es de 
gran importancia para predecir el comportamiento dinámico del sistema. De igual manera, en el 
diseño de sistemas de control en tiempo discreto, es muy importante la localización de los polos y de 
los ceros en el plano z. A continuación investigaremos cómo se comparan las localizaciones de los 
polos y de los ceros en el plano s con las localizaciones de los polos y de los ceros en el plano z. 

Cuando en el proceso se incorpora un muestreo por impulsos, las variables complejas z y s 
quedan relacionadas mediante la ecuación 


Pen 


Esto significa que un polo en el plano s puede quedar localizado en el plano z mediante la transfor- 
mación z = e". Dado que la variable compleja s está formada de una parte real g y una parte imagi- 
naria w, tenemos 


s=0+j0w 


z = eTO tio) = gT0 piTo = ¿To piTo + 27k) 


De esta última ecuación vemos que los polos y los ceros en el plano s, donde las frecuencias difieran 
en múltiplos enteros de la frecuencia de muestreo 277/T, corresponden a las mismas localizaciones en 
el plano z. Esto significa que por cada valor de z existirá un número infinito de valores de s. 

Dado que ø es negativo en el semiplano izquierdo del plano s, el semiplano izquierdo del 
plano s corresponde a 


z| =e”<1 


El eje jw en el plano s corresponde a |z| = 1. Esto es, el eje imaginario en el plano s (la línea o = 0) 
corresponde al círculo unitario en el plano z, y el interior del círculo unitario corresponde al semiplano 
izquierdo del plano s. 
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Franja primaria y franjas complementarias. Observe que, en vista de que <z = wT, el 
¿rzulo de z varía desde —< hasta x conforme w varía desde -~ a x. Tomemos un punto representa- 
o en el eje jæ del plano s. Conforme este punto se mueve sobre el eje jæ desde ~j+ w, hasta j+ w, 
zando æ, la frecuencia de muestreo, tenemos que |z| = 1, y Zz varía desde —71 hasta 71, en dirección 
contraria a las manecillas del reloj en el plano z. Conforme el punto representativo se mueve desde 

- w, hasta j4 œ, sobre el eje jæ, el punto correspondiente en el plano z traza un círculo unitario en 
rección contraria a las manecillas del reloj. Por lo tanto, conforme el punto en el plano s se mueve 
¿n el plano jæ desde —x hasta x, dibujaremos el círculo unitario en el plano z un número infinito de 
„eces, De este análisis, resulta claro que cada franja de ancho w, en el semiplano izquierdo del plano 
- se transformará al interior del círculo unitario del plano z. Esto implica que el semiplano izquierdo 
¿el plano s puede dividirse en un número infinito de franjas periódicas, tal y como se muestra en la 
“¡ura 4-1. La franja primaria se extiende desde jw = -j+ w, hasta j+ w, Las franjas complementarias 
z extienden desde j+ w, hasta jż w, j¡30w, hasta ¡30,. . ., y desde ¿+ œw, hasta j} w, ~j} w, hasta 
A 
En la franja primaria, si trazamos la secuencia de los puntos 1-2-3-4-5-1 en el plano s, tal y 
¿omo se muestra mediante los números encerrados en un círculo en la figura 4-2a), entonces esta 
ravectoria corresponde al círculo unitario con centro en el origen del plano z, como se muestra en la 
“igura 4-26). Los puntos correspondientes 1, 2, 3, 4 y 5 del plano z se muestran mediante números 
encerrados en un círculo en la figura 4-2b). 

El área encerrada por cualquiera de las franjas complementarias se transforma en el mismo 
<:rculo unitario en el plano z. Esto significa que la correspondencia entre el plano z y el plano s no es 








j% 
. 5w, 
LZ 
Franja Plano s 
complementaria 
E j 3w, 
S y 2 m 
Franja Plano z 


complementaria 


= ws 
13 
Franja A 
primaria 0 g 
s aa ws 
S NE 


Franja 
complementaria 


` 





30, 
e 
Franja 
complementaria 
2 A > 5w, 
2 


Figura 4-1 Franjas periódicas en el plano s y región corespondente (circulo unitario con 
centro en el origen) en el plano z. 
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Franja 


primaria 





a) b) 


Figura 4-2 Diagramas que muestran la correspondencia entre la franja primaria en el plano s y el círculo 
unitario en el plano z: a) una trayectoria en el plano s; b) la trayectoria correspondiente en el plano z, 


única. Un punto en el plano z corresponde a un número infinito de puntos en el plano s, aunque un 
punto en el plano s corresponda a un solo punto del plano z. 

Dado que la totalidad del semiplano izquierdo del plano s corresponde al interior del círculo 
unitario en el plano z, la totalidad del semiplano derecho del plano s corresponde al exterior del 
círculo unitario en el plano z. Tal y como fue mencionado anteriormente, el eje jæ del plano s se 
transforma en el circulo unitario del plano z. Note que, si la frecuencia de muestreo es por lo menos 
dos veces mayor que la componente de frecuencia más alta involucrada en el sistema, entonces cada 
uno de los puntos del círculo unitario del plano z representarán frecuencias entre —+ w, y +0,. 

Ahora investigaremos la correspondencia de algunos de los contornos de uso común del plano 
s hacia el plano z. De manera específica, haremos la correspondencia de los lugares geométricos de 
atenuación (factor de amortiguamiento real) constante, de frecuencia constante y de factor de 
amortiguamiento relativo constante. 


Lugar geométrico de atenuación constante. Una línea de atenuación constante (una línea 
trazada con ø = constante) en el plano s corresponde a un circulo de radio z = e”” con centro en el 
origen del plano z, como se muestra en la figura 4-3. 


Tiempo de asentamiento t, El tiempo de asentamiento queda determinado por el valor de la 
atenuación ø de los polos dominantes en lazo cerrado. Si se especifica el tiempo de asentamiento, es 
posible dibujar una línea a = —a, en el plano s que corresponda a un tiempo de asentamiento dado. 
La región en el plano s a la izquierda de la línea o = -g corresponde en el plano z a la parte interior 
de un círculo de radio e”””, tal y como se muestra en la figura 4-4. 


Lugar geométrico de frecuencia constante. Un lugar geométrico de frecuencia constante w 


= w, en el plano s corresponde en el plano z a una línea radial de ángulo constante Tw, (en radianes), 
como se muestra en la figura 4-5. Note que las líneas de frecuencia constante en w = ++ w, en el 
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Plano $ Plano z 





a) b) 


Figura 4-3 a) Lineas de atenuación constante en el plano s; b) lugar geométrico correspondiente en el plano z. 


semiplano izquierdo del plano s corresponden al eje real negativo entre 0 y —l en el plano z, dado que 
T(++0w,) = r. Las líneas de frecuencia constante en w = ++ w, en el semiplano derecho del plano s 
corresponden al eje real negativo del plano z entre ~l y —x, El eje real negativo del plano s corres- 
ponde al eje real positivo del plano z entre 0 y 1. Y las líneas de frecuencia constante en w = X»0w, (2 
=0, 1,2,...) en el semiplano derecho del plano s corresponden al eje real positivo del plano z, entre 
lex, 

La región limitada por las líneas de frecuencia constante w = w, y œ = —w, (donde tanto w, 
como w, ocurren entre —+ w, y + 0,) y las líneas de atenuación constante o = 0, y o = -0,, COMO se 
muestra en la figura 4-6a), corresponden a una región limitada por dos líneas radiales y dos arcos 
circulares, como se muestra en la figura 4-65). 





a) b) 


Figura 4-4 «) Región para un tiempo de asentamiento 7, menor que 4/0, en el plano 
s; b) región para un tiempo de asentamiento 7, menor que 4/0, en el plano z. 
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PW 
4 Plano s im Plano z 


eT tiwa) e 0 tio 


z= 


TE 





a) b) 
Figura 4-5 a) Lugares geométricos de frecuencia constante en el plano s; b) lugares geométricos correspondientes 
en el plano z. 

Lugares geométricos de factor de amortiguamiento relativo constante. Una línea de factor 
de amortiguamiento relativo constante (una línea radial) en el plano s corresponde a una espiral en el 
plano z. Esto se puede observar como sigue. En el plano s una línea de factor de amortiguamiento 
relativo constante puede ser determinada por 


S = ~o, + jo, V1— E = -go + jog 


Im Plano z 


jw Plano s 





nj E 


jw, 





02 





a) b) 





Figura 4-6 a) Región limitada por lineas w= w,, w=—w,, 4 =—0d, y a =—0, en el plano s; b) región 
correspondiente en el plano z. 
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donde œ= w, y!1-¿* [vea la figura 4-7a)]. En el plano z esta línea se convierte en 


z = e =exp(—(0,T + ju¿T) 
- expl PTE y ea) 
= exp e Za + RS 
Por lo tanto, 
2m os) (4-1) 
= expl| - === — 
e 
y 


agp , 
PE (4-2) 
Entonces, la magnitud de z se reduce y el ángulo de z aumenta linealmente conforme «w,se incrementa 
y el lugar geométrico en el plano z se convierte en una espiral logarítmica, como se muestra en la 
figura 4-70). 

Observe que para una relación w,/w, dada, la magnitud |z| se convierte en una función sólo de 
£, y el ángulo de z se convierte en una constante. Por ejemplo, si el factor de amortiguamiento 
relativo está especificado como 0.3, es decir ¢ = 0.3, entonces para w, = 0,25w, tenemos 

27 x 0.3 
lzl = exp- PA x 0.25} = 0.610 
l V1 -— 0,3 


[2 = 27 x 0.25 = 0.577 = 90° 


Lugar geométrico 
de ¿ constante 


Línea de factor de 
amortiguamiento [w 
relativo constante 





Plano z 





a) b) 


Figura 4-7 a) Línea de factor de amortiguamiento relativo constante en el plano s; b) lugar geométrico correspondiente 


en el plano z. z 
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Para œw = 0.50,, 
He exp- 2r X ES 
V1-0,3 
/2=21x0.5=%"w= 180 


x o.s) = 0.3725 


Por lo tanto, se puede graduar la espiral en función de una frecuencia normalizada w,/w, [vea la 
figura 4-76)]. Una vez especificada la frecuencia de muestreo w, se puede determinar el valor numé- 
rico de œ, en cualquiera de los puntos de la espiral. Por ejemplo, en el punto P de la figura 4-76), se 
puede determinar w, como sigue. Si, por ejemplo, la frecuencia de muestreo está especificada como 
w, = 107r rad/s, entonces el punto P 


TT Wd 
E 278 
6 W; 
De ahí, œw, en el punto P es 
wa = 50, = ¿rr rad/sec 


Observe que si una línea de factor de amortiguamiento relativo constante está en el segundo o en 
el tercer cuadrante del plano s, entonces la espiral decrece dentro del círculo unitario en el plano z. Sin 
embargo, si una línea de factor de amortiguamiento relativo constante aparece en el primero o en el 
cuarto cuadrante del plano s (lo que corresponde a una amortiguación negativa), entonces la espiral 
crece por fuera del círculo unitario. En la figura 4-8 se muestran los lugares geométricos de un factor de 
amortiguamiento relativo constante para ¢ = 0, ¢ = 0.2, ¢ = 04, ¿=0.6, ¿= 0,8 y ¿= 1. El lugar 
geométrico de ¢ = 1 es una línea horizontal entre los puntos z = 0 y z = 1. (Note que la figura 4-8 sólo 
muestra los lugares geométricos correspondientes al semiplano superior del plano z, lo que corresponde 
a0<0w<23 w, Los lugares geométricos correspondientes a —7 œw, < w < 0 son las imágenes de espejo de 
los lugares geométricos del semiplano superior del plano z en relación con el eje horizontal.) 

Adviértase que los lugares de ¢ constante son normales a los lugares geométricos de w, cons- 
tante en el plano s, como se ve en la figura 4-9a). En la correspondencia con el plano z, los lugares 
geométricos de w, constante intersectan las espirales de las ¢ constantes en ángulos constantes, como 
se muestran en la figura 4-9b). Una correlación o transformación como ésta, que conserva tanto la 
dimensión como el sentido de los ángulos, se conoce como mapeo o correspondencia conforme. 








Im 


Plano z 








-1.0 -0.5 $=1 0.5 1.0 Re 
Figura 4-8 Lugares geométricos del factor de amortiguamiento relativo constante en el plano z. 
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-- 7325 geométricos /t 
22 ¿ constante 






Plano s 





--zares geométricos 
ze w, constante 


a) b} 
Figura 4-9 a) Diagrama que muestra la ortogonalidad o perpendicularidad de los lugares geométricos de las ¢ constantes 
y de los lugares geométricos de los w, constantes dentro del plano s; b) diagrama correspondiente en el plano z. 


Regiones del plano s y del plano z para ¿> £,. La figura 4-10 muestra los lugares geométricos 
de ¢ constante (¢ = £,) tanto en el plano s como en el plano z. Note que las espirales logarítmicas 
mostradas corresponden a la franja primaria en el plano s. (Si se satisface el teorema de muestreo, 
sólo necesitaremos considerar la franja primaria del plano s.) 

Si todos los polos del plano s se definen como con un factor de amortiguamiento relativo no 
menor que el valor especificado /,, entonces los polos deberán ocurrir a la izquierda de la línea de 
factor de amortiguamiento relativo constante en el plano s (la región sombreada). En el plano z, los 
polos deberán presentarse en la región limitada por las espirales logarítmicas correspondientes a ¢ = 
¿, (la región sombreada). 


Ejemplo 4-1 


Especifique la región en el plano z que corresponda a una región deseable (región sombreada) del plano 
s limitada por las líneas w= + w, las líneas ¿= £, y una línea o =-—0,, tal y como se muestra en la figura 


ds 





Plano s 





b) 


a) 


Figura 4-10 a) Región correspondiente a ¿> /, en el plano s; b) región 
correspondiente a ¿> £, en el plano z. 
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jo Plano s 


Plano z 


jw 


Y ai Y e 
o] 1 


0% 





a) b) 


Figura 4-11 a) Una región deseable en el plano s para la localización de los polos en lazo 
cerrado; b) región correspondiente en el plano z. 


Con base en los análisis anteriores sobre la correspondencia del plano s con el plano z, la región 
deseable puede ser transformada (mapeada) al plano z como aparece en la figura 4-11b). 

Note que si los polos dominantes del sistema de control en tiempo continuo en lazo cerrado deben 
estar en la región deseable especificada en el plano s, entonces los polos dominantes del sistema de 
control equivalente en tiempo discreto en lazo cerrado deberán también ocurrir dentro de la región del 
plano z que corresponda a la región deseable del plano s. Una vez diseñado el sistema de control en 
tiempo discreto, deberán verificarse las características de respuesta del sistema mediante experimentos o 
simulación. Si las características de respuesta no son satisfactorias, entonces deberán modificarse las 
localizaciones de los polos y los ceros en lazo cerrado, hasta que se obtengan los resultados satisfactorios. 


Comentarios. Para sistemas de control en tiempo discreto, es necesario tener especial cuida- 
do con el periodo de muestreo T. Esto es en razón de que, si el período de muestreo es demasiado 
largo y el teorema de muestreo no es satisfecho, entonces ocurrirá un doblamiento de frecuencia y se 
modificarán las localizaciones efectivas de los polos y los ceros. 

Suponga que un sistema de control en tiempo continuo tiene en el plano s polos en lazo cerra- 
do en s =—0, + jw. Si en ese sistema se involucra la operación de muestreo y si w > +w, siendo w, 
la frecuencia de muestreo, entonces ocurrirá un doblamiento de frecuencia y el sistema se comporta- 
rá como si tuviera polos en s =-—ad, + ¡(w, + no,), donde n= 1,2,3,.... Esto significa que la 
operación de muestreo dobla los polos exteriores de la franja primaria hacia el interior de la franja 
primaria, y los polos volverán a aparecer en s =—0, + (w, — w,); vea la figura 4-12a). En el plano z 
estos polos serán transformados en un par de polos complejos conjugados, tal y como se muestra en 
la figura 4-126). Cuando ocurre un doblamiento de frecuencia, se observarán oscilaciones con fre- 
cuencias w,- œw, en vez de la frecuencia w). 











4-3 ANÁLISIS DE ESTABILIDAD DE SISTEMAS EN LAZO CERRADO 
EN EL PLANO z 


Análisis de estabilidad de un sistema en lazo cerrado. A continuación analizaremos la es- 
tabilidad de los sistemas de control en tiempo discreto lineales e invariantes con el tiempo de una entra- 


da/una salida. Considere el siguiente sistema con función de transferencia de pulso en lazo cerrado: 
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jw Plano s 








ilw, — w) 


jw, 
[0,12 
(o, m w) 


Franja primana 





a) b) 
Figura 4-12 a) Diagrama que muestra los polos en el plano s en ~o; + jw, y los polos con doblamiento que 
aparecen en —0, + j(w, + w,), 0, + ¡(w, +2w,), .. . , b) correspondencia en el plano z de los polos del plano 
s En -0 + 0,0, E j(w +0,),-0, +/(0,+20)),.... 
C()__ CR) 
RG) 1+ GH(2z) 
La estabilidad del sistema que define la ecuación (4-3), así como la de otros tipos de sistemas de 
control en tiempo discreto, puede determinarse por las localizaciones de los polos en lazo cerrado en 
el plano z, o por las raíces de la ecuación característica 


P(2) =1+ GH(2)=0 





(4-3) 


como sigue: 


1. Para que el sistema sea estable, los polos en lazo cerrado o las raíces de la ecuación caracterís- 
tica deben presentarse en el plano z dentro del círculo unitario. Cualquier polo en lazo cerrado 
exterior al círculo unitario hace inestable al sistema. 

2. Siun polo simple se presenta en z = 1, entonces el sistema se convierte en críticamente estable. 
También el sistema se convierte en críticamente estable si un solo par de polos complejos 
conjugados se presentan sobre el círculo unitario en el plano z. Cualquier polo múltiple en lazo 
cerrado sobre el círculo unitario hace al sistema inestable. 

3. Los ceros en lazo cerrado no afectan la estabilidad absoluta y por lo tanto pueden quedar 
localizados en cualquier parte del plano z 


Entonces, un sistema de control en lazo cerrado en tiempo discreto lineal e invariante con el 
tiempo de una entrada/una salida se vuelve inestable si cualquiera de los polos en lazo cerrado se 
presenta por fuera del círculo unitario y/o cualquier polo múltiple en lazo cerrado se presenta sobre 


el círculo unitario del plano z. 
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Ejemplo 4-2 
Considere el sistema de control en lazo cerrado que aparece en la figura 4-13. Determine la estabilidad 
del sistema cuando K = 1. La función de transferencia en lazo cerrado G(s) del sistema es 
l-e” 1 


ES sS s(s +1) 








Refiriéndose a la ecuación (3-58), la transformada z de G(s) es 
all ea 1 0.3679z + 0.2642 
G(2) == = 
s  sí(s +1) (z — 0.3679)(z — 1) 
En vista de que la función de transferencia pulso en lazo cerrado para el sistema es 
CG)__G() 
R(z) 1+ G(z) 





(4-4) 





la ecuación característica es 


1+ G(z)=0 
que se convierte en 
(z — 0.3679)(z — 1) + 0.36792 + 0.2642 = 0 
o bien 
z? — z + 0.6321 = 0 
Las raíces de la ecuación característica se encuentra que son 
zı = 0.5 + j0.6181, z2 = 0.5 — j0.6181 


En vista de que 
lza = [21 < 1 


el sistema es estable. 


Es importante observar que en ausencia del muestreador, un sistema de segundo orden es 
siempre estable. Sin embargo, en presencia del muestreador, un sistema de segundo orden como éste 
puede hacerse inestable para valores de ganancia grandes. De hecho, puede demostrarse que si K > 
2.3925 el sistema de segundo orden que aparece en la figura 4-13 se puede convertir en inestable. 
(Vea el ejemplo 4-7.) 


Métodos para probar la estabilidad absoluta. Se pueden aplicar tres pruebas de estabilidad 
directamente a la ecuación característica P(z) = 0, sin tener que resolver las raíces. Dos de ellas son 
la prueba de estabilidad de Schur-Cohn y la prueba de estabilidad de Jury. Estas dos pruebas revelan 





Figura 4-13 Sistemas de control en lazo cerrado del ejemplo 4-2. 
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ʻa existencia de cualquier raíz inestable (raíces qu. -. el prano z se presentan fuera del círculo 
«nitario). Sin embargo, estas pruebas no dan las localizaciones de las raíces inestables, ni indican los 
afectos de cambios en los parámetros sobre la estabilidad del sistema, excepto en el caso sencillo de 
sistemas de bajo orden. (Vea el ejemplo 4-7.) El tercer método está basado en la transformación 
cilineal conjuntamente con el criterio de estabilidad Routh, que será descrito más adelante en esta 
sección. (En el capítulo 5 estudiaremos el análisis de estabilidad de Liapunov, que es aplicable a 
sistemas de control definidos en el espacio de estados.) 

Tanto la prueba de estabilidad de Schur-Cohn como la prueba de estabilidad de Jury pueden 
aplicarse a ecuaciones polinómicas con coeficientes reales o complejos. Los cálculos requeridos en 
la prueba de Jury, cuando la ecuación polinómica implica únicamente coeficientes reales, son mucho 
más sencillos que los requeridos en la prueba de Schur-Cohn. En vista de que los coeficientes de las 
ecuaciones características correspondientes a sistemas físicamente realizables son siempre reales, es 
preferible la prueba de Jury sobre la prueba de Schur-Cohn. 


La prueba de estabilidad de Jury. Al aplicar la prueba de estabilidad de Jury a una ecuación 
característica dada P(z) = 0, construimos una tabla cuyos elementos se basan en los coeficientes de 
P(z). Suponga que la ecuación característica P(z) es un polinomio en z, como sigue: 


P(z) = az" + az" + “++ + Ap-12 +a (4-5) 
donde a, > 0. Entonces la tabla de Jury se construye como se ve en la tabla 4-1. 

Observe que los elementos del primer renglón están formados por los coeficientes en P(z) 
arreglados en orden de potencias ascendentes de z. Los elementos del segundo renglón están forma- 
dos por los coeficientes de P(z) arreglados en orden de potencias descendentes de z. Los elementos 
correspondientes a los renglones 3 hásta 2n -3 se obtienen mediante los siguientes determinantes: 


TABLA 4-1 FORMA GENERAL DE LA TABLA DE ESTABILIDAD DE JURY 



























































Renglón zo z! z2 z3 
a 1 An an -1 an -2 Gn -3 
2 ao a; 42 a3 
la 
3 bn -3 bn-2 bn -3 bn -4 
E Tr 
4 bo bi ba b; 
bs 4 
5 Cn -2 Cn -3 Cn-4 Cn-5 
E + 
6 Co ĉi C2 C3 
— 
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2n —5 P3 Pa Pi Po 
-H 
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An Qn-i-k 








b; = , k=0,1,2,...,n-— 1 
do Ok 
LE br bn-2-x oen z 
Ck = bo be p k=0,1,2,...,n- 2 
= |P Par k = 0,1,2 
qk Po Dia > rt, 








Note que el último renglón de la tabla está formado por tres elementos. (Para sistemas de segundo 
orden, 2n — 3 = 1 y la tabla de Jury estará sólo formada por un renglón, que contiene tres elementos.) 
Observe que los elementos en cualquier renglón par son simplemente los inversos del renglón impar 
inmediatamente anterior. 


Criterio de estabilidad mediante la prueba de Jury. Un sistema con la ecuación caracterís- 


tica P(z) = O dado por la ecuación (4-5), y rescrito de la forma 


P(z) = aoz” + a"? 4---+4,-12 +4, 


donde a, > 0, es estable, si todas las condiciones siguientes se satisfacen: 


1. 
2. 
3. 
4. 


la, S % 
P(2)|.-1>0 
POL E 0 para n par 
i < 0 para n impar 
|b,- il > [bol 
|c, - 2l > [co] 


[gal > lgd 


Ejemplo 4-3 


Construya la tablá de estabilidad de Jury para la siguiente ecuación característica: 
P(z) = aoz* + a12? + az’ + 032 + a4 


donde a, > 0. Escriba las condiciones de estabilidad. 

A partir del caso general de la tabla de estabilidad de Jury dado en la tabla 4-1, puede construirse 
una tabla de estabilidad de Jury para el sistema de cuarto orden, tal y como se muestra en la tabla 4-2. La 
tabla ha sido modificada ligeramente en relación con la forma estándar y resulta conveniente para los 
cálculos de las b y de las c. El determinante incluido en la parte intermedia de cada renglón da el valor de 
b o de c escrito en el lado derecho del mismo renglón. 

Las condiciones de estabilidad son las siguientes: 


1. ja] <a, 
2. P(l)=a¿+a,+a,+a3+a,>0 
3. P(-1)= a-a; + a,-az+a4>0, n=4= par 
4. |b;| > [bol 
[e3| > eol 
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TABLA 4-2 TABLA DE ESTABILIDAD DE JURY PARA EL SISTEMA DE CUARTO ORDEN 


Renglón zo 





Debe hacerse notar que el valor de c, (o bien, tratándose de un sistema de orden n, el valor de q,) 
no es utilizado en la prueba de estabilidad y, por lo tanto, el cálculo de c, (o q,) puede omiítirse. 


Ejemplo 4-4 
Examine la estabilidad de la ecuación característica siguiente: 


P(z) = z* — 1.22* + 0.072? + 0.32 — 0.08 = 0 


Note que, para esta ecuación característica 


a =l 

a, = -1.2 
a = 0.07 
a, = 0.3 

a, = —0.08 


Es claro que la primera condición ja,| < apse satisface. Examinemos la segunda condición en relación con 
la estabilidad: 


P(1) = 1 - 1.2 + 0.07 + 0.3 — 0.08 = 0.09 > 0 
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La segunda condición también es satisfecha. La tercera condición de estabilidad se convierte en 


P(-1) = 1 + 1.2 + 0.07 — 0.3 — 0.08 = 1.89 > 0, n =4= par 
Por lo tanto, se satisface la tercera condición. 

Ahora construiremos la tabla de estabilidad de Jury. A partir del ejemplo 4-3, calculamos los 
valores de by, bz, b, y by y de c, y de cy. El resultado aparece en la tabla 4-3. (Aunque en la tabla aparece 
el valor de c,, éste no es necesario en la prueba de estabilidad y, por lo tanto, no necesita ser calculado.) 
De esta tabla, obtenemos 


le] = 0.946 > 0.315 = [col 


Por lo tanto, se satisfacen ambos elementos de la cuarta condición dados en el ejemplo 4-3. Una vez 
satisfechas todas las condiciones de estabilidad, la ecuación característica dada es estable o, lo que es lo 
mismo, todas las raíces están dentro del círculo unitario en el plano z. 

De hecho, la ecuación característica dada P(z) puede ser factorizada como sigue: 


P(z) = (z — 0.8)(z + 0.5)(z — 0.5)(z — 0.4) 


Como era de esperarse, el resultado obtenido concuerda con el hecho de que todas las raíces están en el 
interior del círculo unitario en el plano z. 


TABLA 4-3 TABLA DE ESTABILIDAD DE JURY PARA EL SISTEMA DEL EJEMPLO 4-4 














Renglón | z? z! z? z3 zó 
—0.08 l | 
= b; = —0.994 


1 —0.08 














—0.08 1.2 





=b, = 1.176 



































= (9 = 0.946 








= co = 0.315 











www.FreeLibros.me 


lacción 4-3 Análisis de estabilidad de sistemas en lazo cerrado en el plano z 189 
Ejemplo 4-5 
Examine la estabilidad de la ecuación característica dada por 


P(z) = z? - 1.12? -0.12+02=0 


Primero identificamos los coeficientes: 


do =1 

a = -1.1 
a, = —0.1 
az = 0.2 


Las condiciones de estabilidad en la prueba de Jury para el sistema de tercer orden son las siguientes: 


1. [ax < a 
2. P(1)>0 
3. P(—-1) <0, n = 3 = impar 
4. [bal > [bol 


La primera condición, jas] < a, claramente se satisface. Ahora examinemos la segunda condición de la 
prueba de estabilidad de Jury: 








P(1)=1-11-0.1+0.2=0 


Esto indica que por lo menos una raíz está en z = 1. Por lo tanto, como máximo el sistema es críticamente 
estable. Las pruebas siguientes determinarán si el sistema es críticamente estable o es inestable. (Si la 
ecuación característica dada representa un sistema de control, la estabilidad crítica no es deseable, Llega- 
do a este punto puede detenerse la prueba de estabilidad.) 

La tercera condición de la prueba de Jury nos da 


P(—1)= -1 -1.1 + 0.1 + 0.2 = -1.8 < 0, n=3= impar 


La tercera condición se satisface. Ahora veamos la cuarta condición de la prueba de Jury. Cálculos 
sencillos dan b, = —0.96 y b, =—0.12. De ahí 


lb,| > [bo 


La cuarta condición de la prueba de Jury se satisface. 

Del análisis anterior concluimos que la ecuación característica dada tiene una raíz en el círculo 
unitario (z = 1) y las otras dos raíces en el interior del círculo unitario en el plano z. Por lo tanto, el sistema 
es críticamente estable. 


Ejemplo 4-6 
Un sistema de control tiene la siguiente ecuación característica: 


P(z) = z? — 1.32? — 0.087 + 0.24 = 0 


Determine la estabilidad del sistema. 
Primero identificamos los coeficientes: 


a= 1 

a = -1.3 
az = —0.08 
az = 0.24 
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Es claro que se satisface la primera condición de estabilidad, Jas] < ay. A continuación, examinamos la 
condición segunda para estabilidad: 


P(1) = 1-— 1.3 — 0.08 + 0.24 = -0.14<0 


La prueba indica que la segunda condición de estabilidad es violada. El sistema es, por lo tanto, inestable. 
Podemos detener la prueba aquí. 


Ejemplo 4-7 
Consideremos el sistema de contro! con realimentación unitaria en tiempo discreto (con período de muestreo 
T= | segundo) cuya función de transferencia pulso en lazo abierto está dada por 


K(0.3679z + 0.2642) 

(z — 0.3679)(z — 1) 

Determine el rango de valores de la ganancia K para estabilidad, mediante la prueba de estabilidad de 
Jury. 


G(2) = 


La función de transferencia pulso en lazo cerrado se convierte en 


CUY K(0.3679z + 0.2642) 
R(z) z° + (0.3679K — 1.3679)}z + 0.3679 + 0.2642K 





Por lo tanto, la ecuación característica para el sistema es 


P(z) = 2? + (0.3679K — 1.3679)z + 0.3679 + 0.2642K = 0 


Dado que se trata de un sistema de segundo orden, las condiciones de estabilidad de Jury pueden escribir- 
se como sigue: 


L ja, <a, 
2. P(1)>0 
3. PE1)>0, n=2= par 


Aplicaremos ahora la primera condición de estabilidad. En vista de que a, = 0.3679 + 0.2642K y 
a, = 1, la primera condición de estabilidad se convierte en 


10.3679 + 0.2642K| < 1 
es decir 

2.3925 > K > -5.1775 (4-6) 
La segunda condición de estabilidad se convierte en 

P(1) = 1 + (0.3679K — 1.3679) + 0.3679 + 0.2642K = 0.6321K >0 
lo que da 
K>0 (4-7) 
La tercera condición de estabilidad da 
P(-1) = 1 — (0.3679K — 1.3679) + 0.3679 + 0.2642K = 2.7358 — 0.1037K > 0 


que resulta 
e 26.382 > K (4-8) 
Para estabilidad, la constante de ganancia K debe satisfacer las desigualdades (4—6), (4-7) y (4-8). Por lo 
tanto, 
2.3925 > K >0 
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El rango de la constante de ganancia K para estabilidad está entre 0 y 2.3925. 

Si la ganancia K se define igual a 2.3925, entonces el sistema se convierte en críticamente estable 
(lo que significa que en la salida existirán oscilaciones sostenidas). La frecuencia de las oscilaciones 
sostenidas puede determinarse, si se escribe 2.3925 en lugar de K en la ecuación característica y se 
investiga la ecuación resultante. Con Ķ = 2,3925, la ecuación característica se convierte en 


z° -0.48772+1=0 


Las raíces características están en z = 0,2439 + ¡0.9698. Si observamos que el período de muestreo T = 1 
segundo, de la ecuación (4-2) tenemos 


ws 277 1. 0.9698 
E AA = = / 
wa => / 2 > /z = tan 0.2439 1.3244 rad/seg 


La frecuencia de las oscilaciones sostenidas es 1.3244 rad/seg. 





Análisis de estabilidad mediante la transformación bilineal y el criterio de estabilidad de 
Routh. Otro método muy utilizado en el análisis de estabilidad de los sistemas de contro! en tiem- 
po discreto es el uso de la transformación bilineal, junto con el criterio de estabilidad de Routh. El 
método requiere de la transformación del plano z a otro plano complejo, el plano w. Aquellos que 
estén familiarizados con el criterio de estabilidad de Routh-Hurwitz encontrarán el método sencillo 


y sin rodeos. Sin embargo, la cantidad de cálculo requerido es mucho mayor que en el criterio de 
estabilidad de Jury. 


La transformación bilineal definida por 








y e +1 
w-1 
misma que, al ser resuelta en función de w, da 
yaz Fd 
z-=1 


hace corresponder el interior del círculo unitario del plano z con el semiplano izquierdo del plano w. 
Esto puede verse como sigue. Hagamos que la parte real de w sea ø y la parte imaginaria w, de tal 
forma que 


w =o + jw 


En vista de que el interior del círculo unitario en el plano z es 





z= 2H] -= [Std 1 
w-=1 o+jw-1 
es decir 

(0 + 1) + w i 

(æ -1 +a 
obtenemos 

(o+ 1) +a < (0-1 +o 

lo que da 


oao<Q 
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Entonces, el interior del círculo unitario (|z| < 1) en el plano z corresponde al semiplano izquierdo del 
plano w. El círculo unitario en el plano z corresponde al eje imaginario en el plano w, y la parte 
externa del círculo unitario en el plano z corresponde al semiplano derecho del plano w. (Debe 
señalarse que, aunque el plano w es similar al plano s en que éste corresponde al interior del círculo 
unitario hacia el semiplano izquierdo, de ninguna manera es cuantitativamente equivalente al plano 
s. Por lo tanto, la estimación de la estabilidad relativa del sistema a partir de las localizaciones de los 
polos en el plano w es difícil.) 

En el análisis de estabilidad, utilizando la transformación bilineal junto con el criterio de esta- 
bilidad de Routh, primero pondremos (w + 1)/(w — 1) en lugar de z en la ecuación característica 


P(2)= az" +42 +- + aniz +a, =0 


como sigue: 








w+1Y w+1Y" w+1 
do + al —— + ++ An-1 +a, =0 
w-=1 w-1 w-1 


Entonces, si simplificamos las fracciones multiplicando ambos miembros de esta última ecuación 
por (w — 1)”, obtenemos: 


Q(w) = baw" + bw" O + Dp-1W + b,=0 


Una vez que transformemos P(z) = 0 en Q(w) = 0, es posible aplicar el criterio de estabilidad de 
Routh de la misma forma que en los sistemas en tiempo continuo. 

Debe hacerse notar que la transformación bilineal junto con el criterio de estabilidad de Routh 
indicará exactamente cuántas raíces de la ecuación característica están en el semiplano derecho del 
plano w, y cuántas sobre el eje imaginario. Sin embargo, en el diseño de sistema de control, la in- 
formación relacionada con el número exacto de polos no estables por lo general no es necesaria, por- 
que no se desean sistemas de control inestables o críticamente estables. Tal y como fue mencionado 
antes, la cantidad de cálculos que este método necesita es mucho mayor que la requerida en la prueba 
de estabilidad de Jury. Por lo tanto, seguiremos más adelante con este tema. Nos permitimos referir 
al lector al problema A-4-3, donde el método presente es utilizado para el análisis de estabilidad. 


Unos cuantos comentarios sobre la estabilidad de sistemas de control en lazo cerrado 


1. Si estamos interesados en el efecto de algún parámetro de sistema sobre la estabilidad de un 
sistema de control en lazo cerrado, podría resultar útil un diagrama del lugar geométrico de las 
raíces. Puede usarse MATLAB para calcular y graficar un diagrama del lugar geométrico de 
las raíces. 

2. Debe notarse que, en la prueba de la estabilidad de una ecuación característica, pudiera resul- 
tar más simple, en algunos casos, determinar directamente las raíces de la ecuación caracterís- 

, tica mediante el uso de MATLAB, 

1.3. Es importante observar que la estabilidad no tiene nada que ver con la habilidad de un sistema 
para seguir una entrada específica. La señal de error en un sistema de control en lazo cerrado 
puede aumentar sin límite, aun si el sistema es estable. (Vea la sección 4-4 en relación con un 
análisis de las constantes de los errores.) 
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ANÁLISIS DE RESPUESTA TRANSITORIA Y EN ESTADO PERMANENTE 


La estabilidad absoluta es un requisito básico de todos los sistemas de control. Además, en cualquier 
sistema de control también se requiere de una buena estabilidad relativa y precisión en estado per- 
manente, ya sea en tiempo continuo o en tiempo discreto. 

En esta sección estudiaremos las características de las respuestas transitorias y en estado per- 
manente de los sistemas de control en lazo cerrado. La respuesta transitoria corresponde a aquella 
parte de la respuesta debida a los polos del sistema en lazo cerrado y la respuesta en estado perma- 
nente corresponde a aquella parte de la respuesta debida a los polos de la función de entrada o 
excitación. 

Con frecuencia los sistemas de control en tiempo discreto son analizados mediante entradas 
“estándar”, como son entradas escalón, entradas rampa o entradas senoidales. Esto es debido a que 
la respuesta del sistema a una entrada arbitraria puede ser estimada a partir de su respuesta corres- 
pondiente a dichas entradas estándar. En esta sección, consideraremos la respuesta del sistema de 
control en tiempo discreto a entradas en el dominio del tiempo, como son entradas escalón. 


Especificaciones de la respuesta transitoria. En muchos casos prácticos, las características 
de desempeño deseadas de los sistemas de control, sean en tiempo continuo o en tiempo discreto, se 
especifican en términos de cantidades en el dominio de tiempo. Esto ocurre debido a que los siste- 
mas con almacenamiento de energía no pueden responder en forma instantánea y siempre que estén 
sujetos a entradas o perturbaciones mostrarán algunas respuestas transitorias. 

Con frecuencia, las características de desempeño de un sistema de control están especificadas 
en términos de su respuesta transitoria a una entrada escalón unitario, ya que la entrada escalón 
unitario es fácil de generar y es lo suficientemente drástica para proporcionar información útil tanto 
de las características de la respuesta transitoria como de la respuesta en estado permanente del sistema. 

La respuesta transitoria de un sistema a una entrada escalón unitario depende de las condicio- 
nes iniciales. Por comodidad, al comparar respuestas transitorias de varios sistemas, es común utili- 
zar la condición inicial estándar: el sistema está inicialmente en reposo y la salida y todas sus deriva- 
das con respecto al tiempo son cero. Las características de respuesta pueden entonces compararse 
sin dificultad. 

La respuesta transitoria de un sistema de control práctico, donde la señal de salida es en tiempo 
continuo, a menudo muestra oscilaciones amortiguadas antes de llegar al estado permanente. (Esto 
es cierto para la mayoría de los sistemas de control en tiempo discreto o digitales, porque las plantas 
a controlarse en la mayor parte de los casos son en tiempo continuo y, por lo tanto, las señales de 
salida son en tiempo continuo.) 

Considere, por ejemplo, el sistema de control digital que se muestra en la figura 4-14. La salida 







Controlador 
digital 





FiguradvlAv. Brest Bs canso! digital. 


194 Diseño de sistemas de control en tiempo discreto mediante métodos convencionales Capítulo 4 


clt) 





a) 








O Figura 4-15 a) Respuesta escalón unitario del sistema 
0 kr mostrado en la figura 4-14; b) salida en tiempo discreto 
correspondiente a la respuesta escalón unitario. 


b} 


c(t) de un sistema como éste a una entrada escalón unitario puede mostrar oscilaciones amortigua- 
das, tal y como se muestra en la figura 4-15a). En la figura 4-15b) aparece la salida en tiempo 
discreto c(kT). 

Igual que en el caso de los sistemas de control en tiempo continuo, la respuesta transitoria de 
un sistema de control digital puede caracterizarse no sólo por el factor de amortiguamiento relativo 
y la frecuencia natural amortiguada, sino también por el tiempo de levantamiento, los sobrepasos 
máximos, el tiempo de asentamiento y así sucesivamente, en respuesta a una entrada escalón. De 
hecho, en la especificación de distintas características de la respuesta transitoria, es común especifi- 
car las cantidades siguientes: 


ESPECIFICACIONES DE LA RESPUESTA TRANSITORIA 


. Tiempo de retardo £, 
Tiempo de levantamiento £, 
Tiempo pico £, 

Sobrepaso máximo M, 

. Tiempo de asentamiento ?, 


Las especificaciones de la respuesta transitoria antes mencionadas en la respuesta escalón 
unitario son definidas a continuación y aparecen en forma gráfica en la figura 4-16. 


1. Tiempo de retardo t,. El tiempo de retardo es el tiempo requerido para que la respuesta llegue 
a la mitad del valor final la primera vez. 
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Y 


iR 


citi A 


Tolerancia permisible 





























Figura 4-16 Curva de respuesta escalón unitario que muestra las especificaciones de 
respuesta transitorias fp t tp M, Y te 


Tiempo de levantamiento t,. El tiempo de levantamiento es el tiempo que requiere la respuesta 
para pasar de 10% hasta 90%, de 5% a 95% o de 0% a 100% de su valor final. según la 
situación. Para sistemas de segundo orden subamortiguados, por lo regular se utiliza el tiempo 
de levantamiento de 0% a 100%. Para sistemas sobreamortiguados y sistemas con atraso de 
transporte, comúnmente se utiliza el tiempo de levantamiento de 10% a 90%. 

Tiempo pico t, El tiempo pico es el tiempo requerido para que la respuesta llegue a la primera 
cresta del sobrepaso. 

Sobrepaso máximo M, El sobrepaso máximo es el valor máximo de la curva de respuesta 
medido a partir de la unidad. Si el valor final en estado permanente de la respuesta difiere de la 
unidad, entonces es común utilizar el sobrepaso porcentual máximo. Queda definido por la 
relación 


elt, )-c(co) 


0 o, 
qo 100% 


Sobrepaso máximo en porcentaje = 


La cantidad de sobrepaso máximo (en porcentaje) indica en forma directa la estabilidad relati- 
va del sistema. 

Tiempo de asentamiento t.. El tiempo de asentamiento es el tiempo requerido para que una 
curva de respuesta llegue y se quede dentro de un rango alrededor del valor final de un tamaño 
especificado, en función de un porcentaje absoluto de valor final, por lo general 2%. El tiempo 
de asentamiento está relacionado con la constante de tiempo de mayor valor en el sistema de 
control. 


Las especificaciones en el dominio del tiempo que acabamos de dar son muy importantes, ya 


que la mayor parte de los sistemas de control son sistemas en el dominio del tiempo; esto es, deben 
mostrar respuestas aceptables en el tiempo. (Lo que significa que el sistema de control bajo diseño 
deberá ser modificado hasta que la respuesta transitoria sea satisfactoria.) 


No todas las especificaciones que acabamos de definir se aplican necesariamente a un caso 
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dado. Por ejemplo, en el caso de un sistema sobreamortiguado, no son aplicables los términos co- 
rrespondientes al tiempo pico y el sobrepaso máximo. Por otra parte, algunas especificaciones pu- 
dieran incluirse: para aquellos sistemas que generan errores en estado permanente en caso de entra- 
das escalón, el error deberá conservarse dentro de un nivel porcentual especificado. (Más adelante 
en esta sección se hará un análisis detallado de los errores en estado permanente.) 

Supongamos que se satisface el teorema de muestreo y que no ocurre doblamiento de frecuen- 
cia. La naturaleza de la respuesta transitoria de un sistema de control en tiempo discreto a una 
entrada dada depende de las localizaciones reales de los polos y ceros en lazo cerrado en el plano z. 
Considere el sistema de control en tiempo discreto definido por 


C()_ baz” + biz"! +--+ b, 
R(z) z” +az! +- +a, 





(4-9) 


donde R(z) es la transformada z de la entrada y C(z) es la trasformada z de la salida. Con MATLAB, 
es fácil obtener la respuesta transitoria de un sistema como éste, a entradas delta Kronecker, a entra- 
das escalón, a entradas rampa, y asi sucesivamente. Vea, por ejemplo, el ejemplo 4-8. 


Ejemplo 4-8 
Considere el sistema de control en tiempo discreto definido por 


C(2) 0.4673z — 0.3393 
R(2) 2% — 1.5327z + 0.6607 
Obtenga la respuesta escalón unitario de este sistema. 


En el programa MATLAB 4-1 aparece un programa MATLAB para obtener la respuesta escalón 
unitario. La gráfica resultante de c(k) en función de k se muestra en la figura 4-17. 








(4-10) 








MATLAB Programa 4-1 

Yor = Respuesta escalón unitario —— 
num=[0 0.4673 -0.3393]); 
den=(1 -1.5327 0.6607); 
r= ones(1,41); 

v=[0 40 0 16); 

axis(v); 

k=0: 40; 

c = filter(num,den,r); 
plot(k,c“o') 

grid 

title('Unit-Step ResponseA) 
xlabel('k) 

ylabel('c(k)') 











Análisis de error en estado permanente. Una característica importante asociada con la res- 
puesta transitoria es el error en estado permanente. El desempeño en estado permanente de un siste- 
ma de control estable se juzga en general por el error en estado permanente debido a entradas esca- 
lón, rampa y de aceleración. A continuación investigaremos un tipo de error en estado permanente 
que es causado por la incapacidad de un sistema para seguir tipos especiales de entradas. (Deberá 
notarse que, además de este tipo de error en estado permanente, existen errores que pueden ser 


atribuidos a otras causas, como imperfegciones en Jos gomponentes del sistema, fricción estática, 
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Respuesta escalón unitario 
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Figura 4-17 Respuesta escalón unitario del sistema definido por la ecuación (4-10). 
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zonas muertas, o el deterioro o edad de los componentes. En esta sección, sin embargo, no analiza- 
remos errores en estado permanente debidos a estas causas.) 

En forma inherente, cualquier sistema físico de control sufre de error en estado permanente en 
respuesta a ciertos tipos de entrada. Esto es, un sistema pudiera no tener ningún error en estado 
permanente a entradas escalón, pero el mismo sistema puede mostrar error en estado permanente 
distinto de cero en respuesta a entradas rampa. Dependerá del tipo de la función de transferencia en 
lazo abierto del sistema si un sistema dado muestra o no error en estado permanente en respuesta a 
un tipo dado de entrada. 

Considere el sistema de control en tiempo continuo cuya función de transferencia en lazo 
abierto G(s)H(s) está dada por 
K(T,s + Ds +1): (Tas +1) 

STs + (Bs + 1) (s +1) 








G(s)H(s) 


El término s” en el denominador representa un polo de multiplicidad N en el origen. Es costumbre clasi- 
ficar el sistema de acuerdo con el número de integradores en la función de transferencia en lazo abierto. 

Se dice que un sistema es de tipo 0, tipo 1, tipo2,...,siN=0,N=1,N=2,...,respectiva- 
mente. Los sistemas de tipo 0 mostrarán errores finitos en estado permanente en respuesta a entradas 
escalón y errores infinitos en respuesta a entradas rampa o de orden superior. Los sistemas de tipo 1 
no mostrarán ningún error en estado permanente en respuesta a entradas escalón, errores finitos en 
estado permanente en respuesta a entradas rampa, y errores infinitos en estado permanente en res- 
puesta a entradas de aceleración y de orden mayor. Conforme se incrementa el número de tipo, la 
precisión aumenta. Sin embargo, al incrementar el tipo, el problema de estabilidad se complica. 
Siempre será necesario un término medio entre la precisión en estado permanente y la estabilidad 
relativa (características de la respuesta transitoria). 

Los conceptos de las constantes de error estático pueden extenderse al sistema de control en 
tiempo discreto, como se analiza a continuación. 
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Los sistemas de control en tiempo discreto pueden clasificarse según el número de polos en 


lazo abierto en z = l. (Un polo en lazo abierto en z = | corresponde a un integrador en el lazo.) 
Suponga que la función de transferencia pulso en lazo abierto está dada por la ecuación 
LB 


Función de transferencia pulso en lazo abierto = 


E=D* AG) 


donde B(2)/4(2) no contiene ni polos ni ceros en z = 1. Entonces el sistema se puede clasificar como 
sistema de tipo 0, sistema de tipo 1 o sistema de tipo 2, según si N = 0, N = } o N =2, respectivamen- 
te. El tipo de sistema define las características del sistema en estado permanente o la precisión en 
estado permanente. 

El significado físico de las constantes de error estático para sistemas de control en tiempo 
discreto es el mismo que en los sistemas de control en tiempo continuo, excepto que el primero sólo 
transmite información en los instantes de muestreo. 

Considere el sistema de control en tiempo discreto que se muestra en la figura 4-18. Supone- 
mos que el sistema es estable, de tal forma que el teorema de valor final puede aplicarse para la 
determinación de los valores en estado permanente, Del diagrama tenemos el error de actuación 


elt) = r(t) — b(t) 


Consideraremos el error de actuación en estado permanente en los instantes de muestreo. Note que a 
partir del teorema del valor final tenemos 


lime(kT) = lim[( ~ z7)E(z)] (4-11) 
k>x z=l 


Para el sistema mostrado en la figura 4-18, definimos 


a) = 0-97 20] 


GH()=(1= 297 LO! 


S 


Entonces tenemos 


cz) __ CR) 
R(z) 1+ GH(z) 





E(z) = R(2) ~ B(z) = R(z) ~ GH(2)E(2) 





Figura 4-18 Sistema de control 
en tiempo discreto. 
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o 
1 
E(z) = 1 GHG O (4-12) 
Al escribir la ecuación (4-12) en la ecuación (4-11) obtenemos 
1 
= lj = z7) 4-13 
Es im 0 E ORO) as 


Como en el caso del sistema de control en tiempo continuo, consideraremos tres tipos de entradas: 
escalón unitario, rampa unitaria y entradas de aceleración unitaria. 


Constante de error de posición estática. Para una entrada escalón unitario r(A = 1(£), tenemos 
1 

R(z) == 

( ) 1 -z 1 


Si escribimos esta última ecuación en la ecuación (4-13), el error de actuación en estado permanente 
en respuesta a una entrada escalón unitario se puede obtener como sigue: 
1 1 . 1 
SAR Aa + limi A 7 
1 + GH(z)l1-z 221 1 + GH(2) 
Definimos la constante de error de posición estática K,, como sigue: 


e = im = z`’) 


2>1 


K, = lim GH(2) (4-14) 


Entonces el error de actuación en estado permanente en respuesta a una entrada escalón unitario 

puede obtenerse a partir de la ecuación 

AS: 
1+ K, 

El error de actuación en estado permanente en respuesta a una entrada escalón unitario se convierte 

en cero si K, =>, lo que requiere que GH(=) tenga por lo menos un polo en z= l. 


es, (4-15) 


Constante de error de velocidad estática. Para una entrada rampa unitaria r(£) = t1(£), tenemos 


Tz- 
R(z) = a- rY 
Al colocar esta última ecuación en la ecuación (4-13), tenemos 
; 1 Tz T 
s = l O E =o : a 
o [a PA CA ima 56H0 


Ahora definimos la constante de error de velocidad estática K, como sigue: 
(1-2 1GH(z) 
= lim ———— 
z>1 T 
Entonces el error de actuación en estado permanente en respuesta a una entrada rampa unitaria 
puede ser dado por 


K, (4-16) 


== 4.17 
ĉis K, (4.17) 


Si K, = œ, entonces el error de actuación en estado permanente en respuesta a una entrada rampa 
unitaria es cero. Esto requiere que GH(z) posea un polo doble en z = 1. 
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Constante de error de aceleración estática. Para una entrada de aceleración unitaria r(£) = 
+ 1(£), tenemos 


TAZA 
R(z) = a-y 
Al escribir esta última ecuación en la ecuación (4-13), obtenemos 
f Ñ 1 T(1 + n l T? 
55 = 1 1 o 1 — o. = — e o 
á im Dic 202 A MAGA 


Definimos la constante de error de aceleración estática K, como sigue: 


¿Y 
K, n tim e Z POH) (4-18) 
2>1 T* 
Entonces el error de actuación en estado permanente se convierte en 
1 
=> 4-19 
e =k (4-19) 


El error de actuación en estado permanente en respuesta a una entrada de aceleración unitaria se 
convierte en cero si K, = x. Esto requiere que GH(z) posea un polo triple en z = 1. 

Las ecuaciones (4-15), (4-17) y (4-19) dan las expresiones para los errores de actuación en 
estado permanente del sistema de control en tiempo discreto que aparece en la figura 4-18, en los 
instantes de muestreo para entradas escalón unitario, rampa unitaria y de aceleración unitaria, res- 
pectivamente. 


Resumen. Es importante enfatizar que el error de actuación es la diferencia entre la entrada 
de referencia y la señal de realimentación, y no la diferencia entre la entrada de referencia y la salida. 
Del análisis anterior vemos que un sistema de tipo 0 mostrará un error de actuación en estado perma- 
nente constante, en respuesta a una entrada escalón y un error de actuación infinito, en respuesta a 
entradas rampa, de aceleración o de orden superior. Un sistema de tipo 1 mostrará un error de actua- 
ción en estado permanente cero de respuesta escalón, un error en estado permanente constante en 
respuesta a una entrada rampa y un error de actuación en estado permanente infinito en respuesta a 
entradas de aceleración o de orden superior. 


TABLA 4-4 TIPOS DE SISTEMAS Y LOS ERRORES CORRESPONDIENTES AL 
ESTADO PERMANENTE EN RESPUESTA A ENTRADAS ESCALÓN, RAMPA Y 
ACELERACIÓN PARA EL SISTEMA DE CONTROL EN TIEMPO DISCRETO QUE SE 
MUESTRA EN LA FIGURA 4-18 


Errores en estado permanente en respuesta a 


ÓN Entrada de 
Sistema Entrada escalón Entrada rampa aceleración 


r(1) =1 r(t) =t 0 =+4 
Sistema de tipo 0 
Sistema de tipo 1 


Sistema de tipo 2 
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La tabla 4-4 lista los tipos de sistemas y los errores correspondientes al estado permanente, en 
respuesta a entradas escalón, rampa y de aceleración para el sistema de control en tiempo discreto de 
la configuración mostrada en la figura 4-18. 

El análisis de error en estado permanente que acabamos de presentar es aplicable al sistema de 
control en tiempo discreto en lazo cerrado mostrado en la figura 4-18. Para una configuración distin- 
ta en lazo cerrado, debe hacerse notar que si el sistema de control en tiempo discreto en lazo cerrado 
tiene una función de transferencia pulso en lazo cerrado, entonces se pueden determinar las constan- 
tes de error estáticas mediante un análisis similar al que acaba de presentarse. La tabla 4-5 muestra 
las constantes de errores básicos para configuraciones en lazo cerrado típicas de sistemas de control 
en tiempo discreto. Si el sistema de control en tiempo discreto en lazo cerrado no tiene una función 
de transferencia pulso en lazo cerrado, sin embargo, las constantes de error estático no pueden definirse, 
porque la señal de entrada no puede separarse de la dinámica del sistema. 

Es importante notar que los términos “error de posición”, “error de velocidad” y “error de 
aceleración” significan desviaciones en estado permanente de la posición de salida. Un error de 
velocidad finito implica que después de que los transitorios hayan desaparecido, la entrada y la 
salida se mueven a la misma velocidad, pero tienen una diferencia finita de posición. 


TABLA 4-5 CONSTANTES DE ERROR ESTÁTICO PARA CONFIGURACIONES EN 
LAZO CERRADO TÍPICAS DE SISTEMAS DE CONTROL EN TIEMPO DISCRETO. 





Configuración en lazo cerrado Valores de Kp, K, y Ka 
E = > 
Kp = lim GH (z) 








= lim É =z GH (z) 
i T 


21 


. (U—2"1)GH() 
= lim A 


21 T 





= lim G(z)H (z) 


o 0-2 )G(2)H(z) 
= lim 


21 T 


n (1 —2z7}G(z)H (z) 
= lim T? 


2>1 





= lim G(2)AG Az) 


= li loz Gíz2)HG Az 
:= 1 T 


Siit Q —z~)G G)HGAZ) 


221 T? 








= lim Gr(2)G z)H (2) 


. 1 2 DE ADIGADA) 
, = lim 


21 T 


— tim 126 )G ADE 


2>1 T? B 
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Respuesta a perturbaciones. Al examinar las características de respuesta transitoria y los 
errores en estado permanente, es importante observar que, además de los correspondientes a las 
entradas de referencia, deberán ser explorados los efectos de perturbaciones. 

Para el sistema mostrado en la figura 14-19a), supongamos que la entrada de referencia es 
cero, es decir R(z) = 0, pero el sistema está sujeto a la perturbación M(=). Para este caso, el diagrama 
de bloques del sistema puede volverse a dibujar como se muestra en la figura 4-19). Entonces la 
respuesta C(z) a la perturbación M(z) puede encontrarse a partir de la función de transferencia pulso 
en lazo cerrado 


E O LS 
N(2) 1 + Go(2)G(z) 


Si |G (2)G(z)| >> 1, entonces encontramos 


Clz)_ 1 








N(2) ” Guí(z) 
Niz) 


Riz)=0 








a) 





b) 


Figura 4-19 a) Sistema de control digital en lazo cerrado sujeto a una entrada de referencia y a 
una entrada de perturbación; b) diagrama de bloques modificado donde la entrada de perturbación 
se considera la entrada al sistema. 
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Dado que el error del sistema es 
E(2) = R(2) - C(2) = -C(2) 
encontramos que el error £(=) debido a la perturbación M2) es 
1 
Go(2) 
Por lo tanto, mientras mayor sea la ganancia de G,(z) menor será el error de E(=). Si G,(=) incluye un 
integrador [lo que significa que G,(z) tiene un polo de z = 1] entonces el error en estado permanente 


debido a una perturbación constante es cero. Esto se puede ver como sigue. Dado que para una 
perturbación constante de magnitud N tenemos 





E(z) = - N(z) 


N 
N(2) Mie 


si G, (2) implica un polo en z = 1 entonces puede ser escrito en la forma 
Gp(2) _ Golz)z" 
-1 Fsg 
donde G, (z) no implica ningún cero en z = 1. Entonces el error en estado permanente puede estar 
dado por 





Gp(z) 





S 
2 
Il 


. LA sE aii ENE) 
[o-o] -nla -ag 
al 
tim E) IA a soim OM 
z—=1 1-27" Gp(2) 1 Gpíz)z"! 

Si un sistema lineal está sujeto tanto a una entrada de referencia como a una entrada de pertur- 
bación, entonces el error resultante es la suma de los errores debidos a la entrada de referencia y a la 
entrada de perturbación. El error total deberá de conservarse dentro de límites aceptables. 

Observe que el punto donde la perturbación entra en el sistema es muy importante en el ajuste 
de la ganancia de G,(23G(=). Por ejemplo, considere el sistema mostrado en la figura 4-20a). La 
función de transferencia pulso en lazo cerrado para la perturbación es 


C(2) __ E) 1 
NG) NG) 1+ Go(z)G(z) 


A fin de minimizar los efectos de la perturbación N(=) en el error del sistema £(=), la ganancia de 
G, ()G() debe hacerse lo más grande posible. Sin embargo, para el sistema mostrado en la figura 
4-20b), la función de transferencia pulso en lazo cerrado para la perturbación es 


C(z2) _ _ Elz) e Gp(2)G(z) 

N(2)  N(z) 1+Gp(2)G(2) 
y para minimizar los efectos de la perturbación V(z) en el error de sistema E(=), la ganancia de 
G, (z)G(2) debe hacerse tan pequeña como sea posible. 

Por lo tanto, resulta ventajoso obtener la expresión para £(=)/N(=) antes de concluir si la ga- 
nancia de G,(=2)G(=) deberá ser grande o pequeña para minimizar el error debido a perturbaciones. 
Es importante recordar, sin embargo, que la magnitud de la ganancia no puede ser determinada sólo 
a partir de consideraciones de perturbación. Debe determinarse considerando las respuestas tanto de 
las entradas de referencia como de perturbación. Si las regiones de frecuencia para la entrada de 
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Niz) 





Niz) 


b) 


Figura 4-20 a) Sistema de control digital en lazo cerrado sujeto a la entrada de referencia y a la 
entrada de perturbación; b) sistema de control digital en lazo cerrado donde la perturbación entra al 
lazo de realimentación. 


referencia y para la entrada de perturbación están suficientemente separadas, puede insertarse un 
filtro adecuado en el sistema. Si las regiones de frecuencia se superponen, deberá entonces modificarse 
la configuración del diagrama de bloques para obtener respuestas aceptables tanto a entradas de 
refereneia-como de perturbación. 


4-5 DISEÑO BASADO EN EL MÉTODO DEL LUGAR GEOMÉTRICO DE LAS RAÍCES 


Tal como se discutió en la sección 4-4, la estabilidad relativa del sistema de control en tiempo discre- 
to puede ser investigada en relación con el círculo unitario en el plano z. Por ejemplo, si los polos en 
lazo cerrado son complejas conjugadas y ocurren dentro del círculo unitario, la respuesta escalón 
unitario será oscilatoria. 
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Además de las características de respuesta transitoria de un sistema dado, a menudo resulta 
necesario investigar los efectos de la ganancia del sistema o del período de muestreo del sistema 
sobre la estabilidad absoluta y relativa del sistema en lazo cerrado. Para estos fines, el método del 
lugar geométrico de las raíces es muy útil. 

El método del lugar geométrico de las raíces desarrollado para sistemas en tiempo continuo 
puede ser extendido sin modificaciones a sistemas en tiempo discreto, excepto por que el límite de 
estabilidad queda modificado del eje ja en el plano s al círculo unitario en el plano z. La razón por la 
cual el método del lugar geométrico de las raíces puede extenderse a sistemas en tiempo discreto es 
porque la ecuación característica correspondiente al sistema en tiempo discreto tiene la misma forma 
que la del sistema en tiempo continuo en el plano s. Por ejemplo, para el sistema mostrado en la 
figura 4-21 la ecuación característica es 


1 + G(z)H(z2)=0 


que es exactamente de la misma forma que la ecuación del análisis del lugar geométrico de las raices 
en el plano s. Sin embargo, la localización de los polos para los sistemas en lazo cerrado en el plano 
z debe ser interpretada en forma distinta a la correspondiente en el plano s. 

En esta sección demostraremos la aplicación del método del lugar geométrico de las raíces al 
diseño de sistemas de control en tiempo discreto o digitales. 

Los programas de computadora para el cálculo y graficación de los lugares geométricos de las 
raíces están disponibles para la mayor parte de los sistemas de computación. En particular, MATLAB 
proporciona un medio conveniente para graficar el lugar geométrico de las raíces tanto para sistemas 
en lazo cerrado en tiempo continuo como en tiempo discreto. La gráfica exacta del lugar geométrico 
de las raíces se puede llevar a cabo en la computadora y, por lo tanto, quizás no necesitaremos de 
procedimientos de tipo gráfico. Sin embargo, es una ventaja tener cierta destreza en el graficado del 
lugar geométrico de las raíces, porque ello permitirá al ingeniero de control llevar a cabo gráficas 
rápidas para problemas específicos y así acelerar etapas preliminares del diseño del sistema. De 
hecho, un ingeniero de control experimentado a menudo utiliza el método del lugar geométrico de 
las raíces para un diseño preliminar, a fin de localizar los polos dominantes en lazo cerrado en las 
posiciones deseadas del plano z y a continuación utilizar simulación digital para mejorar el desempe- 
ño en lazo cerrado. 


Condiciones de ángulo y magnitud. En muchos sistemas de control en tiempo discreto li- 
neales e invariantes con el tiempo, la ecuación característica puede tener cualquiera de las dos si- 
guientes formas: 


1 + G(z)H(2) =0 


1 + GH(z) = 0 


Ciz} 


Figura 4-21 Sistema de control en lazo cerrado. 
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Para combinar estas dos formas en una, definamos la ecuación característica como 


1+F(2)=0 (4-20) 
donde 


F(z) = G(2)H(2) o F(z) = GH(z) 


Observe que F(z) es la función de transferencia pulso en lazo abierto. La ecuación característica 
dada por la ecuación (4-20) se puede escribir en la forma 


F(z)= -1 


Dado que F(z) es una cantidad compleja, esta última ecuación se puede dividir en dos ecuaciones al 
igualar primero los ángulos y a continuación las magnitudes de ambos miembros para obtener 


CONDICIÓN DE ÁNGULO: 
LEG) = +180°(2k + 1), k=0,1,2,... 
CONDICIÓN DE MAGNITUD: 
F(z) =1 


Los valores de z que satisfacen tanto las condiciones de ángulo como de magnitud son las raíces de 
la ecuación característica, es decir los polos en lazo cerrado. 

Una gráfica de los puntos en el plano complejo que satisfacen solamente la condición de 
ángulo es el lugar geométrico de las raíces. Las raíces de la ecuación característica (los polos en lazo 
cerrado) que corresponden a un valor dado de la ganancia pueden localizarse en el lugar geométrico 
de las raíces mediante la condición de magnitud. Los detalles de la aplicación de las condiciones de 
ángulo y de magnitud para obtener los polos en lazo cerrado se presentan a continuación. 


Procedimiento general para construir el lugar geométrico de las raíces. Para un sistema 
complicado con muchos polos y ceros en lazo abierto, la construcción de una gráfica del lugar 
geométrico de las raíces pudiera parecer complicado, pero de hecho no es difícil si se aplican las 
reglas establecidas para la construcción de un lugar geométrico de las raíces. 

Mediante la localización de puntos y asíntotas particulares y al calcular los ángulos de partida 
de los polos complejos y los ángulos de llegada a los ceros complejos, es posible construir el lugar 
geométrico de las raíces sin dificultad. Note que mientras el lugar geométrico de las raíces puede ser 
dibujado en forma conveniente mediante una computadora digital, si se intenta la elaboración ma- 
nual de la gráfica del lugar geométrico de las raíces, esencialmente procederemos con base en prue- 
ba y error, pero el número de pruebas requeridas puede reducirse en gran medida si se utilizan las 
reglas establecidas. 

Dado que los polos complejos conjugados en lazo abierto y los ceros complejos conjugados, 
de haber alguno, siempre estarán localizados simétricamente en relación con el eje real, los lugares 
geométricos de las raíces siempre serán simétricos respecto al eje real. Por lo tanto, sólo necesitamos 
construir la parte superior del lugar geométrico de las raíces y dibujar la imagen en espejo de la parte 
superior en la parte inferior del plano z. Recuerde que los ángulos de las cantidades complejas que se 
originan de los polos en lazo abierto y de los ceros en lazo abierto y dibujados al punto de prueba z 
se miden en dirección contraria a las manecillas del reloj. Presentaremos ahora las reglas generales 
y los procedimientos para la construcción del lugar geométrico de las raíces. 


www.FreeLibros.me 


Sección 4-5 Diseño basado en el método del lugar geométrico de las raíces 207 


Reglas generales para la construcción de los lugares geométricos de la raíz 


1. Obtenga la ecuación característica 


1+FG)=0 


y a continuación reacomode esta ecuación de tal forma que el parámetro de interés como la ganancia 
K aparezca como factor multiplicador en la forma 


K(z +23 E + z3) (2 + Zm) 
(z + pi)(z + p2) (Z + pa) 
En el análisis presente, suponemos que el parámetro de interés es la ganancia K, donde K > 0. De la 
forma factorizada de la función de transferencia pulso en lazo abierto, localice los polos y ceros en 
lazo abierto en el plano z. [Note que si F(=) = G(2)H(2), entonces los ceros en lazo abierto son ceros 
de G(=)H(2) en tanto que los ceros en lazo cerrado están formados de los ceros de G(=) y de los polos 
de H(=).] 

2. Determine los puntos de inicio y los puntos de terminación del lugar geométrico de las 
raíces. Encuentre también el número de ramas separadas del lugar geométrico de las raíces. Los 
puntos en el lugar geométrico de las raíces que corresponden a K = 0 son los polos en lazo abierto y 
aquellos que corresponden a X= x son los ceros en lazo abierto. Por lo tanto, conforme K se incrementa 
desde 0 hasta x, un lugar geométrico de las raíces empieza a partir de un polo en lazo abierto y 
termina en un cero finito en lazo abierto o un cero en lazo abierto en el infinito. Esto significa que un 
trazo del lugar geométrico de las raíces tendrá exactamente tantas ramificaciones como existan raí- 
ces en la ecuación característica. [Si se cuentan los ceros en el infinito, F(z) tiene el mismo número 
de ceros que de polos.] 

Si el número » de polos en lazo cerrado es el mismo número que el número de polos en lazo 
abierto, entonces el número de ramificaciones individuales del lugar geométrico de las raíces que 
terminan en ceros en lazo abierto finitos es igual al número »m de ceros en lazo abierto. Las ramifica- 
ciones n — m restantes terminan en el infinito (en los ceros implícitos 7 — m en infinito) a lo largo de 
las asíntotas. 

3. Determine el lugar geométrico de las raíces sobre el eje real. El lugar geométrico de las 
raíces sobre el eje real se determina por los polos en lazo abierto y los ceros que quedan sobre él. Los 
polos y ceros complejos conjugados de la función de transferencia pulso en lazo abierto no tienen 
efecto en la localización del lugar geométrico de las raíces sobre el eje real porque la contribución 
angular de los polos y ceros de un par de polos complejos conjugados es de 360° sobre el eje real. 
Cada parte del lugar geométrico de las raíces sobre el eje real se extiende sobre un segmento desde 
un polo o cero hasta otro polo o cero. 

e Al construir el lugar geométrico de las raíces sobre el eje real, escoja sobre él un punto de 
prueba. Si el número total de polos y ceros reales a la derecha de este punto de prueba es impar, 
entonces este punto cae sobre un lugar geométrico de las raíces. El lugar geométrico de las raíces y 
su complemento forman segmentos alternos a lo largo del eje real. 

4. Determine las asíntotas del lugar geométrico de las raíces. Si el punto de prueba - está 
localizado lejos del origen, entonces los ángulos de todas las cantidades complejas pueden conside- 
rarse iguales. Entonces un cero en lazo abierto y un polo en lazo abierto cada uno cancela los efectos 
del otro. 

Por lo tanto, el lugar geométrico de las raices para valores muy grandes de z debe ser asintótico 
a líneas rectas cuyos ángulos están dados como sigue: 
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: +180° l 
Angulo de la asintota = nert ) N=0,1,2,... 





donde 
n = número de polos finitos de F(z) 
m = número de ceros finitos de F(z) 


Aquí, N = 0 corresponde a la asintota que forma el ángulo más pequeño con respecto al eje real. 
Aunque N supone un número infinito de valores, el ángulo se repite a sí mismo, conforme N aumen- 
ta, y el número de asíntotas diferentes es n — m. 

Todas las asíntotas se cruzan en el eje real. El punto en el cual lo hacen se obtiene de la 
siguiente manera. Dado que 


Klz" + (z1 +2 + 0 + Zm) + +2122***Zm) 
z" + (pp + pat oc: + pr)z""! + ++ + PiP Dna 
a K 
ZIP lp + po + pr) — (a+ zat ee + 2) Jo H +. 
para un valor grande de z esta última ecuación se puede aproximar como sigue: 
A A A o a 
E + (Pi + Pati +P) tzt: sa 





F(z) = 





F(z) = 
n-m 
Si la abscisa de la intersección de las asíntotas y del eje real se identifica como —or, entonces 


PLE Php) lA ER + Zm) 
n-m 


04. = (4-21) 
Debido a que todos los polos y ceros complejos se presentan en pares conjugados, —a,, dado por la 
ecuación (4-21) siempre es una cantidad real. 

Una vez encontrada la intersección de las asíntotas con el eje real, las asíntotas se pueden 
dibujar de inmediato en el plano complejo z. 

5. Encuentre los puntos de ruptura de salida y de ruptura de entrada. En vista de la simetría 
conjugada de los lugares geométricos de las raíces, los puntos de ruptura de salida y de ruptura de 
entrada se presentan o sobre el eje real o en pares complejos conjugados. 

Si un lugar geométrico de las raíces se presenta entre dos polos adyacentes en lazo abierto 
sobre el eje real, entonces existirá por lo menos un punto de ruptura de salida entre ambos polos. En 
forma similar, si el lugar geométrico de las raíces se presenta entre dos ceros adyacentes (un cero 
pudiera estar localizado en —x) sobre el eje real, entonces siempre existirá por lo menos un punto de 
ruptura de entrada entre los dos ceros. 

Si el lugar geométrico de las raíces se presenta entre un polo y un cero (finito o infinito) sobre 
el eje real, entonces pudieran no existir puntos ni de ruptura de salida ni de entrada o pudieran existir 
tanto puntos de ruptura de salida como de entrada. 

Si la ecuación característica 


1+F()=0 
se escribe en la forma 
KB(z) 
14 —— = 
a 
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donde KB(2/4(z2) = F(z), entonces 


¿a 20 


BG) (4-22) 


y los puntos de ruptura de salida y de entrada (que corresponden a raíces múltiples) se pueden 


determinar a partir de las raíces de 


dK _  A'(2)B(2) - A(2)B'(2) 
dz B?(z) g 











0 (4-23) 


donde el apóstrofo indica diferenciación respecto a z. (Vea el problema 4-5 para una prueba.) 

Si el valor de K correspondiente a una raíz z = z, de dK/dz = 0 es positivo, el punto z = z, es un 
punto real de ruptura de salida o de entrada. Dado que se supone que K no es negativo y si el valor de 
K así obtenido es negativo, entonces el punto z = z, no es ni punto de ruptura de salida ni de entrada. 

Observe que este método puede usarse cuando existen polos complejos o ceros complejos. 

6. Determine el ángulo de salida (o el ángulo de llegada) del lugar geométrico de las raíces a 
partir de los polos complejos (o en los ceros complejos). Para dibujar el lugar geométrico de las 
raices con una precisión razonable, debemos encontrar la dirección del lugar geométrico de las raí- 
ces cerca de los polos y de los ceros complejos. El ángulo de salida (o ángulo de llegada) del lugar 
geométrico de las raíces correspondiente a un polo complejo (o a un cero complejo), puede determi- 
narse al sustraer de 180° la suma de todos los ángulos de líneas (cantidades complejas) correspon- 
diente a todos los demás polos y ceros del polo complejo (o del cero complejo) en cuestión, si se 
incluyen los signos apropiados. El ángulo de salida se muestra en la figura 4-22. 

7. Encuentre los puntos donde los lugares geométricos de las raíces cruzan el eje imaginario. 
Los puntos donde el lugar geométrico de las raíces cruza el eje imaginario pueden determinarse 
definiendo z = jv en la ecuación característica (lo que implica la ganancia K no determinada), e 
igualando tanto la parte real como la imaginaria con cero, y se resuelve en función de v y de K. Los 
valores de v y de K que así se encuentren darán la localización en la cual el lugar geométrico de las 
raíces cruza el eje imaginario y el valor de la ganancia correspondiente K, respectivamente. 






Plano z 


Ángulo de salida = 
7 180” — (9, +0, - 4) 


Figura 4-22 Diagrama que muestra el ángulo de salida. 
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8. Cualquier punto de los lugares geométricos de las raíces es un polo en lazo cerrado posi- 
ble. Un punto determinado será un polo en lazo cerrado cuando el valor de la ganancia K satisfaga la 
condición de magnitud. Por otra parte, la condición de magnitud nos permite determinar el valor de 
la ganancia K en un lugar específico de las raíces dentro del lugar geométrico. La condición de 
magnitud es 


F(z) = 1 
es decir 


+2) +2) (+2) aal 
(z + pi)\(z + p) (z +p) K 


Si la ganancia K de la función de transferencia pulso en lazo abierto está dada en el problema, 
entonces mediante la aplicación de la condición de magnitud, ecuación (4-24), es posible localizar 
los polos en lazo cerrado para una K dada en cada una de las ramificaciones del lugar geométrico de 
las raíces mediante un método de prueba y error. 


(4-24) 


Cancelación de los polos de G(z) con los ceros de H(z). Es importante notar que si F(z) = 
G(z)H(z) y el denominador de G(z) y el numerador de H(z) involucran factores comunes, entonces 
los polos y los ceros en lazo abierto correspondientes se cancelarán unos a los otros, si se reduce el 
erado de la ecuación característica en uno o más. La gráfica del lugar geométrico de las raíces de 
G(z)H(z) no mostrará todas las raíces de la ecuación característica, sino sólo las raíces de la ecuación 
reducida. 

A fin de obtener el conjunto completo de polos en lazo cerrado, deberemos añadir los polos 
cancelados o polos de G(z)H(=) a aquellos polos en lazo cerrado obtenidos de la graficación del lugar 
geométrico de las raíces de G(z)H(z). Es importante recordar que un polo cancelado de G(z)H(=) es 
un polo del sistema en lazo cerrado. 

Como ejemplo, veamos el caso donde G(z) y H(z) del sistema mostrado en la figura 4-21 están 
dados por 





ZONE 
SEEN 

y 

z+a 

MNS z+d 
Entonces, claramente el polo z = —a de G(z) y el cero z = —a de H(z) se cancelan uno al otro, lo que 
resulta en 
SE ZE z+a ZE 


G(z)H(z) = 








(z +a\z+b)z+d (z+bXz +d) 


Sin embargo, la función de transferencia pulso en lazo cerrado del sistema es 











C(z) G(2) (z + 0) +d) 
R(z) 1+ G(z)H(z) (z +a)[(z+bXz+d)+z+c] 
y vemos que z = —a, el polo cancelado de C(z)H(2), es un polo en lazo cerrado del sistema realimentado. 
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Observe, sin embargo, que si la cancelación de polos y ceros'se presenta en la función de 
transferencia pulso de la trayectoria directa, entonces la misma cancelación de polos y ceros se 
presenta en la función de transferencia pulso en lazo cerrado. Considere otra vez el sistema mostrado 
en la figura 4-21 donde suponemos 


G(z) = Go(2)JG (2) H(2)=1 
Suponga que ocurren cancelaciones de polos y ceros en G,(23G (2). Por ejemplo, suponga 


z +b z+d 2 z+d 
z+a(z+bXz+c) (z+a\(z+c) 


Entonces la función de transferencia pulso en lazo cerrado se convierte en 





Gp(z)Gi(z) = 





Cz) ___Goz)G) _ (z + b)(z + d) 
R(2) 1+ Go(z)Gi(z) (z +b)[(z+a)X{z +c) +2 +d] 
z+d 





“lz taz+co)+z+d 


En razón de la cancelación de polos y ceros, el sistema de tercer orden se convierte en uno de 
segundo orden. 

Es importante concluir que el efecto de la cancelación de polos y ceros en G(z) y H(2) es 
distinto al de la cancelación de polos y ceros en la función de transferencia pulso de la trayectoria 
directa (como es la cancelación de polos y ceros en el controlador digital y en la planta). En el 
primero, el polo cancelado sigue siendo un polo del sistema en lazo cerrado, en tanto que en el 
último, los polos cancelados no aparecen como polos en el sistema en lazo cerrado (en este último el 
orden del sistema queda reducido por el número de polos cancelados). 


Diagramas del lugar geométrico de las raíces de los sistemas de control digital. Ahora 
investigaremos los efectos de la ganancia K y del período de muestreo T sobre la estabilidad relativa 
del sistema de control en lazo cerrado. Veamos el sistema mostrado en la figura 4-23, Suponga que 
el controlador digital es del tipo integral, es decir que 


K 
Got) == K 





Dibujemos los diagramas del lugar geométrico de las raíces para el sistema, para tres valores del 
período de muestreo T: 0.5 seg, | seg y 2 seg. También determinemos el valor crítico de K en cada 
uno de los casos. Y, finalmente, localicemos los polos en lazo cerrado correspondientes a K = 2 para 
cada uno de los tres casos. 


rit) 





Riz) 





Controlador G, (8) G ls) 


integral 





Figura 4-23 Sistema de control digital. 
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Primero obtenemos la transformada z de G,(s)G,(s): 





AO -2| = : | 








s+1 
-1-202| 1 

s(s + 1) 
= — sija bi 1 
a razli s+1 
== Ža Z ) 
z 2-1 z-e! 
zieen 
z=- eT 


La función de transferencia pulso de la trayectoria directa se convierte en 





Kz 1- e" 
G(z) = Go(2)21G+(s)G,(s)) = == = (4-25) 
z= Iz= ė 
La ecuación característica es 
1+ G(z)=0 
es decir 
Kz(1 - e`") 
+ — = E 
i -DG-e”) 0 (4-26) 
1. Período de muestreo T = 0.5 seg: para este caso, la ecuación (4-25) se convierte en 
e 0.3935Kz 


(z — DG — 0.6065) 
Observe que G(z) tiene polos en z = 1 y en z = 0.6065 y un cero en z = 0. 

Para dibujar un diagrama del lugar geométrico de las raices, primero localizaremos los polos y 
el cero sobre el plano z y a continuación encontraremos el punto de ruptura de salida y el de entrada. 
Note que esta función de transferencia pulso en lazo abierto con dos polos y un cero da como resul- 
tado un lugar geométrico de las raices circular con centro en el cero. El punto de ruptura de salida y 
el punto de ruptura de entrada se determinan escribiendo la ecuación característica en la forma de la 
ecuación (4-22), 


E g = - LD - 0.6065) 
0.3935z 


y diferencia K con respecto a z igualando el resultado con cero: 


(4-27) 


dK _ _z°— 0.6065 _ 
dz 0.3935z? 
De ahí, 


z? = 0.6065 
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es decir, 
2=0.7788 y z = —0.7788 


Observe que la sustitución de z por 0.7788 en la ecuación (4-27) da un valor de K = 0.1244, en tanto 
que si se supone que z = -0.7788 da un valor de K = 8.041. Dado que ambos valores de K son 
positivos, z = 0.7788 resulta el punto de ruptura de salida real y z = —0.7788 es el punto de ruptura de 
entrada real. 

La figura 4-24a) muestra el diagrama del lugar geométrico de las raices cuando T= 0.5 seg. El 
valor crítico de ganancia K para este caso se obtiene mediante la condición de magnitud, que se 
puede obtener a partir de la ecuación (4-26) como sigue: 


{T= 0.5 seg) 





Círculo unitario 


Plano z 


K=2 (T= 1 seg) 


Círculo unitario 


(T= 2 seg) 


Figura 4-24 a) Diagrama del lugar 
geométrico de las raíces para el sistema 
mostrado en la figura 4-23 cuando T= 0.5 
seg; b) diagrama del lugar geométrico de las 
raíces cuando T= | seg; c) diagrama del 
lugar geométrico de las raíces cuando T= 2 
Círculo unitario seg. 
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z(l- e77) 1 
(z =- DE e" K 
Para el caso presente, T = 0.5 y esta última ecuación se convierte en 
0.3935z 1 





(z — 1)(2 — 0.6065) | K (4-28) 


En vista de que la ganancia crítica K, corresponde al punto z = z —1, sustituimos z por —1 en la 
ecuación (4-28): 


0.3935(-1) 
(=2)(=1.6065) 





=A 
K 








es decir 


K = 8.165 
La ganancia crítica K, es por lo tanto 8.165. 
Los polos en lazo cerrado que corresponden a K = 2 se pueden determinar como 


7,=0.4098 + j0.6623 y  z,=0.4098- 0.6623 


Estos polos en lazo cerrado quedan indicados por puntos en el diagrama del lugar geométrico de las 
raíces. 
2. Período de muestreo T = 1 seg: para este caso, la ecuación (4-25) se convierte en: 


0.6321Kz 
(z — DG — 0.3679) 

Por lo tanto, G(z) tiene polos en z = 1 y en z = 0.3679 y un cero en z = 0. 

Se llega a la conclusión de que el punto de ruptura de salida y el punto de ruptura de entrada 
son z = 0.6065 y z = -0.6065, respectivamente. Los valores correspondientes de ganancia son K = 
0.2449 y K = 4.083, respectivamente. 

En la figura 4-24b) se muestra el diagrama del lugar geométrico de las raíces cuando T= 1 seg. 
El valor crítico de la ganancia K es 4.328. Los polos en lazo cerrado correspondientes a K = 2 se 
determinan del siguiente valor 


zı =0.05185 +j0.6043 y  z,=0.05185-— 0.6043 


y se muestran en el diagrama del lugar geométrico de las raíces mediante puntos. 
3. Período de muestreo T = 2 seg: para este caso, la ecuación (4-25) se convierte en 
0.8647Kz 

(z — 1)(z — 0.1353) 


Vemos que-G(z) tiene polos en z = 1 y en z = 0.1353 y un cero en z = 0. 

El punto de ruptura de salida y el punto de ruptura de entrada se encuentran en z = 0.3678 y en 
z = —0.3678, con valores de ganancia correspondientes K = 0.4622 y K = 2.164 respectivamente. El 
valor crítico de ganancia K para este caso es 2.626. 

La figura 4-24c) muestra el diagrama del lugar geométrico de las raíces cuando T= 2 seg. Los 
polos en lazo cerrado correspondientes a K = 2 son 


7,=0.2971+j0.2169 y  z,=-0.2971-j0.2169 


Estos polos en lazo cerrado se muestran en forma de puntos en el diagrama del lugar geométrico de 
las raíces. 


G(z) = 


G(z) = 
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Efectos del período de muestreo T sobre las características de la respuesta transitoria. Las 
características de la respuesta transitoria del sistema de control en tiempo discreto dependen del 
período de muestreo 7. Un período de muestreo grande tiene efectos dañinos o detrimentales sobre la 
estabilidad relativa del sistema. Una regla práctica es muestrear de ocho a diez veces durante un 
ciclo de las oscilaciones senoidales amortiguadas de la salida del sistema en lazo cerrado, si es que 
éste está subamortiguado. Para sistemas sobreamortiguados, pruebe de ocho a diez veces durante el 
tiempo de levantamiento de la respuesta escalón. 

Como se ha visto en los análisis precedentes, para un valor dado de ganancia K, aumentar el 
periodo de muestreo T hará que el sistema de control en tiempo discreto sea menos estable y que 
eventualmente se convierta en inestable. De manera alternativa, al reducir el período de muestreo T 
se permite que el valor crítico de la ganancia K respecto a la estabilidad sea mayor. De hecho, reducir 
el período de muestreo más y más tiende a hacer que el sistema se comporte muy parecido a un 
sistema en tiempo continuo. (Para un sistema de control de segundo orden en tiempo continuo, la 
ganancia crítica para la estabilidad es infinita, es decir, K = œ.) 

Para el sistema mostrado en la figura 4-23, el factor de amortiguamiento relativo £ para los 
polos en lazo cerrado para K = 2 para cada uno de los tres casos anteriores puede determinarse a 
partir de la figura 4-25. Gráficamente, los factores de amortiguamiento relativo para los polos en 
lazo cerrado correspondientes a T = 0.5, T= 1 y T=2 se determinan en forma aproximada como ¢ = 
0.24, ¢ = 0.32 y ¢ = 0.37, respectivamente. 

El factor de amortiguamiento relativo ¢ de un polo en lazo cerrado se puede determinar en 
forma analítica a partir de la localización del polo en lazo cerrado en el plano z. Si el factor de 
amortiguamiento relativo de un polo en lazo cerrado es /, entonces en el plano s la localización del 
polo en lazo cerrado (en la parte superior) puede darse mediante 


o s= ~ian + jo VI- E 
Dado que z = e”, el punto correspondiente en el plano z es 
z = exp[T(—¿o, + jon V1 — 4] 


Im 
z plane 





$=0.6 


Figura 4-25 Localizaciones de los polos en lazo cerrado en los planos z mostrados 
con lugares geométricos de ¢ constante. 
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del cual obtenemos 


|z| = e 74. (4-29) 


Zz = To, V1 ~ ¿= Toy = 0 (rad) (4-30) 


De las ecuaciones (4-29) y (4-30) se puede calcular el valor de z. Por ejemplo, en el caso en que el 
período de muestreo Tes de 0.5 segundos, tenemos el polo en lazo cerrado para K = 2 en z = 0.4098 
+ j0.6623. Por lo tanto, 


|z| = V0.4098? + 0.6623? = 0.7788 


Resolviendo 
|z| = e Mm = 0.7788 


para el exponente encontramos 


Tlw, = 0.25 (4-31) 
También, 
0.6623 
Zz = tan 4008 = 58.25° = 1.0167 rad 
Por lo tanto, 


/2= To, V1- ¿* = 1.0167 rad (4-32) 
De las ecuaciones (4-31) y (4-32), obtenemos 


Tío, 0.25 


To, V1=¿£ > 1.0167 


es decir, 
CE: A 0,2459 
Vi- ¿? 
lo que nos da 
¿ = 0.2388 


(De la figura 4-25 obtuvimos en forma gráfica 0.24 para ¢, lo cual es muy cercano al valor real ¢ de 
0.2388.) re 

Es importante notar que en un sistema de segundo orden el factor de amortiguamiento relativo 
£ es indicador de la estabilidad relativa (por ejemplo, en relación con el sobrepaso máximo en res- 
puesta a un escalón unitario) sólo si la frecuencia de muestreo es lo suficientemente alta (de tal forma 
que existan de ocho a diez muestras en un ciclo de oscilación). Si una frecuencia de muestreo no es 
lo suficientemente alta, el sobrepaso máximo de la respuesta escalón unitario será mucho mayor de 
lo que podría predecirse por el factor de amortiguamiento relativo ¿. 

Para comparar los efectos de los distintos períodos de muestreo T sobre la respuesta transito- 
ría, compararemos las frecuencias de respuestas escalón unitario correspondientes a los tres valores 
de 7 tomados en cuenta en el análisis precedente. 
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La función de transferencia pulso en lazo cerrado para el sistema de la figura 4-23, cuya 
función de transferencia pulso de la trayectoria directa G(z) está dada por la ecuación (4-25), es 


Cd. Gl)... Kz(1 —- e?) 
R(z) 1+ G(z) G-DG-e)+Kzx-e7) 


Para T= 0.5 seg y K = 2, la respuesta escalón unitario puede estar dada por 








0.3935 x 2z 
C(2)= DG — 0.6065) + 0.3935 x 2204) 
0.787027! 1 


= 12 0.8195z + 0.6065z 21- z` 


de la cual obtenemos la secuencia de respuesta escalón unitario c(kT) en función de kT como se 
muestra en la figura 4-26a). 

De la figura 4-25 vemos que el ángulo 9 de la línea que conecta el origen y el polo dominante 
en lazo cerrado en z = 0.4098 + ¡0.6623 (esta línea es una línea w constante en el plano s) es de 
alrededor de 58.25”. El ángulo 8 de los polos dominantes en lazo cerrado determina el número de 
muestras por ciclo de oscilación senoidal. Observe que 





360° 
cos 6k = cos olx + ) 
Por lo tanto, para el caso en que 0= 58.25°, tenemos que 360°/0 = 360°/58.25° = 6.18 muestras por 
ciclo de oscilación amortiguada, como se ve en la figura 4-26a). 
Similarmente, en el caso en que T= 1 seg y K=2, la respuesta escalón unitario está dada por 


1.26422* 1 
1 — 0.1037z * + 0.3679? 1- z` 


La secuencia de respuesta escalón unitario c(k7) en función de AT aparece en la figura 4-26b). Dado 
que el ángulo en la línea que conecta el origen y el polo en lazo cerrado en este caso es 85.10%, como 
se muestra en la figura 4-25, tenemos aproximadamente 360%/85.10% = 4.23 muestras por ciclo, lo 
que es mucho menos de lo que por lo regular recomendaríamos. (Recomendamos 8 o más muestras 
por ciclo de oscilación de la senoidal amortiguada.) 

Por último, en el caso de T = 2 seg y K= 2, la respuesta escalón unitario está dada por 


1.72947"! 1 
1 + 0.59417! + 0.1353z™? 1 — z`! 
La secuencia de respuesta escalón unitario c(kT) en función de ÁT aparece en la figura 4-26c). De la 
figura-4-25, el ángulo de la línea que conecta el origen y el polo en lazo cerrado para este caso es 
143.87" y en consecuencia tenemos que 360°/143.87° = 2.50 muestras por ciclo, como se ve en la 
figura 4-26c). (Adviértase que una frecuencia de muestreo lenta como son 2.50 muestras por ciclo 
no es aceptable.) 

En la figura 4-26 se han mostrado tres gráficas distintas de la respuesta escalón unitario c(xT) 
en función de kT. Como se puede observar de estas gráficas, si el período de muestreo es pequeño, 
una gráfica de c(k7) en función de kT dará una imagen bastante precisa de la respuesta c(£). Sin 
embargo, si el período de muestreo no es lo suficientemente pequeño, entonces la gráfica de c(kT) en 
función de kT no representará un resultado preciso. Es muy importante seleccionar un período de 
muestreo adecuado basado en la satisfacción del teorema de muestreo, de la dinámica del sistema y 





C(z) = 


C(z) = 
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Figura 4-26 a) Secuencia de la respuesta escalón unitario del sistema mostrado en la figura 
4-23 cuando T= 0.5 seg y K=2; b} secuencia de la respuesta escalón unitario cuando 7'= | 
seg y K = Z7e) secuencia de la respuesta escalón unitario cuando T= 2 seg y K=2. 


de las consideraciones reales del equipo. Note que la simple satisfacción del teorema de muestreo no 
es suficiente. Una regla práctica aceptable es de ocho a diez muestras por ciclo (seis muestras por 
ciclo es marginal) si el sistema es subamortiguado y muestra oscilaciones en la respuesta. 

A continuación, analicemos el efecto del período de muestreo T sobre la exactitud en estado 
permanente. Veremos la respuesta rampa unitaria para cada uno de los tres casos. 

Para el caso en que el período de muestreo T es 0.5 seg y la ganancia K es 2, la función de 
transferencia pulso en lazo abierto es 
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0.7870z 
(z — 1) — 0.6065) 
y la constante de error de velocidad estática K, está dada por 





G(z) 











1 faz, =1 
z>1 
o 1 0.7870z | 
= lim 
zı | 0.5z (2 — 1)(2 — 0.6065) 
=4 
Por lo tanto, el error en estado permanente en respuesta a una entrada rampa unitaria es 
1 1 
ess =k a ne 


De igual manera, para el caso en que T = 1 seg y K = 2, la función de transferencia pulso en 
lazo abierto es 

1.2642z 
(2 — 1)(z — 0.3679) 








G(z) 


la constante de error de velocidad estática K, está dado por 
(= 7 )G(2) 


K, = lim 
2—1 





|z -1 1.2642z | 
z (z= 1) = 0.3679) 


Finalmente, en el caso donde T = 2 seg y K = 2, la función de transferencia pulso en lazo abierto 


es 
1.7294z 


(z = DG = 0.1353) 





G(z)= 


y la constante de error de velocidad estática K, y el error en estado permanente en respuesta a una 
entrada rampa unitaria se obtienen, respectivamente, en la forma 


K,=1 


=—=]1 
Ess K, 


Las partes a), b) y c) de la figura 4-27 muestran, en forma respectiva, las gráficas de la secuencia de 
la respuesta rampa unitaria c(kT) en función de ÁT para los tres casos en consideración. 


www.FreeLibros.me 


220 Diseño de sistemas de control en tiempo discreto mediante métodos convencionales Capítulo 4 
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Figura 4-27 a) Secuencia de la respuesta rampa unitaria del sistema mostrado en la figura 4-23 
cuando T = 0.5 seg y K =2; b) secuencia de la respuesta rampa unitaria cuando T= 1 seg y K= 2; c) 
secuencia de la respuesta rampa unitaria cuando T =2 seg y K= 2. 


Los tres casos que hemos visto demuestran que al aumentar el período de muestreo T se afecta 
en forma adversa la estabilidad relativa del sistema. (Incluso puede en algunos casos causar inesta- 
bilidad.) Es importante recordar que el factor de amortiguamiento relativo ¢ de los polos en lazo 
cerrado del sistema de control digital indica la estabilidad relativa sólo si la frecuencia de muestreo 
es lo suficientemente alta (es decir, de ocho o más muestras por ciclo de oscilación de la senoidal 
amortiguada). Si la frecuencia de muestreo es baja (es decir, de menos de seis muestras por ciclo de 
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oscilación de la senoidal amortiguada), entonces predecir la estabilidad relativa a partir del valor del 
factor de amortiguamiento relativo resultará erróneo. 


Ejemplo 4-9 

Considere el sistema de control digital que se muestra en la figura 4-28. En el plano z, diseñe un controlador 
digital de tal forma que los polos dominantes en lazo cerrado tengan un factor de amortiguamiento 
relativo £ de 0.5 y un tiempo de asentamiento de 2 seg. El período de muestreo se supone en 0.2 seg, es 
decir, 7'= 0.2. Obtenga la respuesta del sistema de control digital diseñado a una entrada escalón unitario. 
También obtenga la constante de error de velocidad estática K, del sistema. 

Para el sistema de segundo orden estándar con un par de polos dominantes en lazo cerrado, el 
tiempo de asentamiento de 2 seg significa que 


lo que da el valor de la frecuencia natural no Ao w, de los polos dominantes en lazo cerrado 


como 
w, = 4 


La frecuencia natural amortiguada w, se determina como 


Wa = Wa V1- £ = 4V1 - 0.5 = 3.464 


En vista de que el período de muestreo T es 0.2 seg, tenemos 
a, = E == 107 = 31.42 


[Note que existen aproximadamente nueve muestras por cada ciclo de oscilación amortiguada (31.42/ 
3.464 = 9.07). Por lo tanto, es satisfactorio el período de muestreo de 0.2 seg.] 

Primero localizaremos los polos dominantes en lazo cerrado deseados en el plano z. Refiriéndonos 
a las ecuaciones (4-29) y (4-30), para un lugar geométrico de los factores de amortiguamiento relativo 
constante, tenemos 


lz| = e Tin = ap(- 2mré 2) 
V1-¿0 


= = Wa 
Z2 Twa = 27 o 


De las especificaciones dadas (4 = 0.5 y w, = 3.464), la magnitud y el ángulo del polo dominante en lazo 
cerrado en la parte superior del plano z se determinan como sigue: 


27 x0.5 3.464 


zi = expl - Vi 05 31.42 





)- e" = 0,6703 


ele) Controlador Retén de 1 
igital orden cero 
Rlz) T digita sis +2) 





Lo 





Figura 4-28 Sistema de control digital para el ejemplo 4-9. 
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3.464 ` 
Zz = 235 47 7 06927 rad = 39.69 


Podemos ahora localizar el polo dominante en lazo cerrado deseado en la parte superior del plano z, que 
se muestra como punto P en la figura 4-29. Note que en el punto P 


z = 0.6703/39.69 = 0.5158 + j0.4281 


Al observar que el período de muestreo T es de 0.2 seg, la función de transferencia pulso G(z) de 
la planta precedida por el retenedor, o retén, de orden cero puede obtenerse como sigue 


1 - e702s 1 e e 1 
G(2) -z| s sís + 5] E la + zl 


Esta última ecuación se puede escribir en la forma 


0.01758(z + 0.8760) 
(z — 1)(z — 0.6703) 

A continuación, localizamos los polos (z = 1 y z = 0.6703) y el cero (z = 0.8760) de G(z) en el 
plano z, tal y como se muestra en la figura 4-29. Si el punto P debe ser la localización del polo dominante 
en lazo cerrado deseado en la parte superior del plano z, entonces los ángulos en el punto P deben ser 
iguales a +180°. Sin embargo, la suma de las contribuciones angulares en el punto P es 


17.10? — 138.52° — 109.84° = —231.26° 


G(z) = 


Por lo tanto, la deficiencia angular es 
—231.26° + 180° = —51.26° 


La función de transferencia pulso del controlador debe proporcionar +51.26°. La función de transferen- 
cia pulso para el controlador se supone como 


Plano z 





Figura 4-29 Diagrama del lugar geométrico de las raíces del sistema considerado en el 
ejemplo 4-9. 
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Ta 


z+8B 





Gpí2) =K 


donde K es la constante de ganancia del controlador. 

Si decidimos cancelar el polo en z = 0.6703 mediante el cero del controlador en z = —a, entonces 
el polo del controlador podrá determinarse (si se parte de la condición de que el controlador debe proveer 
+51.269) como un punto en z = 0.2543 (B =—0.2543). Por lo tanto, la transferencia pulso para el controlador 
puede ser determinada como 


_ z — 0.6703 
Go(2) = K 7072543 


La función de transferencia pulso en lazo abierto ahora se convierte en 
z — 0.6703 0.01758(z + 0.8760) 
z — 0.2543 (z — 1)(2 — 0.6703) 
z 0.01758(z + 0.8760) 

(z — 0,2543)(2 — 1) 


Go(2)G(2) = K 


La constante de ganancia K puede ser determinada a partir de la siguiente condición de magnitud 


|Gp(z)G(z)|z = 0.5158 + jo.a281 = 1 


Por lo tanto, 
0.01758(z + 0.8760) 
(z — 0.2543)(z — 1) l2=0.5158+50.4281 
lo que da 
K = 12.67 
El controlador digital diseñado es 
Gp(z) = 12.677 2A (4-33) 


La función de transferencia pulso en lazo abierto para el sistema actual es 
12.67 x 0.01758(z + 0.8760) 0.2227(z + 0.8760) 


G»(z)G(z) = (z — 0.25432 — 1) (z — 0.2543)(z — 1) 


Por lo tanto, la función de transferencia pulso en lazo cerrado es 


CE) __Gol2)G@) _ __0.2227z + 0.1951 


R(2) 1+ Gp(z)G(z) z? -— 1.0316z + 0.4494 
La respuesta a la entrada escalón unitario R(z) = 1/(1 -z') se puede obtener a partir de 


ce) = ART + 0.1951 1 
2) = 2 1.03162 + 0.4494 1-2" 


2 0.22272 * + 0.195127? 1 
1 — 1.031627! + 0.44942? 1 — z™' 


La figura 4-30 muestra la secuencia de respuesta escalón unitario c(x7) en función de kT. El trazo 
muestra que el sobrepaso máximo es aproximadamente 16% (lo que significa que el factor de 
amortiguamiento relativo es de alrededor de 0.5) y el tiempo de asentamiento es de aproximadamente 2 
seg. El controlador digital que acabamos de diseñar satisface las especificaciones dadas y es satisfacto- 
rio. 
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Figura 4-30 Secuencia de la respuesta escalón unitario del sistema diseñado en el 
ejemplo 4-9. 


La constante de error de velocidad estática K, del sistema está dada por 
| ji- z` 
K, = lim ~y Colz)C(z) 
z>1 


z — 1 0.2227(2 + 0.8760) 
0.2z (z — 0.2543 Mz — 1) 





= lim 
z= 
= 2.801 

Si se requiere tener un valor grande de K,, entonces pudiéramos incluir un compensador de atraso. 
Por ejemplo, añadir un cero en z = 0.94 y un polo en 2 = 0.98 elevaría tres veces el valor de K,, ya que (1 
— 0.94 (1 — 0.98) = 3. (Es importante que el polo y el cero del compensador de atraso se presenten en un 
número finito de puntos discretos asignables.) Un compensador de atraso, que tiene un polo y un cero 
muy cercanos el uno del otro, no cambia en forma significativa el lugar geométrico de las raíces cerca de 
los polos dominantes en lazo cerrado. El efecto de un compensador de atraso sobre la respuesta transito- 
ria es el de introducir una componente transitoria pequeña pero que se reduce lentamente. Sin embargo, 
ese transitorio pequeño pero lento, no es deseable desde el punto de vista de las perturbaciones o de la 
atenuación de ruido, ya que la respuesta a las perturbaciones no se atenuaría rápidamente. 

Por último, debe hacerse notar que aunque el sistema diseñado es del tercer orden, funciona como 
un sistema de segundo orden, ya que un polo de la planta ha sido cancelado por el cero del controlador. 
En vista de lo anterior, el presente sistema tiene solamente dos polos en lazo cerrado. Los polos dominan- 
tes en lazo cerrado en este caso son los únicos polos en lazo cerrado. Si un polo y un cero no se cancelan 
el uno al otro, entonces el sistema será del tercer orden. 


Comentarios. Es importante señalar que los polos de una función de transferencia pulso en 


lazo cerrado determinan los modos naturales del sistema. No obstante, los comportamientos de la 
respuesta transitoria y de la respuesta a la frecuencia quedan influidos en gran medida por los ceros 
de la función de transferencia pulso en lazo cerrado. 
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Resulta útil familiarizarse con la relación entre las localizaciones de los polos y de los ceros 
del plano z y las características de respuesta en el tiempo para el diseño de los sistemas de control en 
tiempo discreto. Es importante notar que en el plano s la adición de un cero en el eje real negativo 
cerca del origen aumenta el sobrepaso máximo en respuesta a una entrada escalón. Un cero como 
éste en el plano s es transformado en un cero en el eje real positivo en el plano z entre 0 y 1. 

Por lo tanto, en el plano z, la adición de un cero en el eje real positivo entre O y 1 aumenta el 
sobrepaso má-ximo. De hecho, mover un cero hacia el punto z = 1 aumentará en gran medida el 
sobrepaso máximo. 

De forma similar, en el plano s un polo en lazo cerrado sobre el eje real negativo cerca del 
origen aumenta el tiempo de asentamiento. En el plano z, ese polo en lazo cerrado se transforma en 
un polo en lazo cerrado sobre el eje real positivo entre 0 y 1. Por lo tanto, un polo en lazo cerrado en 
el plano z entre 0 y 1 (en particular, cerca de z = 1) aumenta el tiempo de asentamiento. Sin embargo, 
la presencia de un polo en lazo cerrado o de un cero en el eje real negativo entre 0 y —1 en el plano z, 
afectará sólo ligeramente la respuesta transitoria. 


6 DISEÑO BASADO EN EL MÉTODO DE RESPUESTA EN FRECUENCIA 


El concepto de respuesta en frecuencia juega un poderoso papel en los sistemas de control digital, de 
la misma forma que lo hace en los sistemas de control en tiempo continuo. Como se indicó antes, en 
este libro se supone que el lector está familiarizado con las técnicas convencionales de diseño me- 
diante la respuesta en frecuencia para los sistemas de control en lazo cerrado. De hecho, es necesaria 
la familiarización con los diagramas de Bode (trazas logarítmicas) en la extensión de las técnicas 
convencionales de la respuesta en frecuencia al análisis y el diseño de los sistemas de control en 
tiempo discreto. 

A menudo han sido utilizados los métodos de respuesta en frecuencia en el diseño de 
compensadores. La razón básica es la sencillez de los métodos. Al llevar a cabo pruebas de respuesta 
en frecuencia sobre un sistema en tiempo discreto, es importante que el sistema tenga un filtro de 
paso bajas antes del muestreador, de tal manera que las bandas laterales estén centradas. Entonces el 
sistema lineal e invariante con el tiempo a una entrada senoidal conserva la frecuencia y modifica 
solamente la amplitud y la fase de la señal de entrada. Por lo tanto, las dos únicas cantidades que 
deben ser manejadas serán la frecuencia y la fase. 

Ahora, analizaremos la respuesta del sistema lineal en tiempo discreto de tiempo invariante 
correspondiente a la entrada senoidal; ese análisis será confirmado mediante la definición de la 
función y transferencia pulso senoidal. 

A continuación estudiaremos el diseño de un sistema de contro! en tiempo discreto en el plano 
w mediante la utilización de un diagrama de Bode. 


Respuesta de un sistema en tiempo discreto lineal e invariante con el tiempo a una entrada 
senoidal. Ya hemos indicado que la respuesta en frecuencia de G(z) puede obtenerse sustituyendo 
2= e" en G(z). A continuación demostraremos que esto es cierto. 

Considere el sistema estable en tiempo discreto lineal e invariante con el tiempo que se mues- 
tra en la figura 4-31. La entrada del sistema G(z) antes del muestreo es 


u(t) = sen mí 
www.FreeLibros.me 


226 ` Diseño de sistemas de control en tiempo discreto mediante métodos convencionales Capítulo 4 


i Sistema estable 
ult) = sin wt en tiempo discreto 
T lineal e invariante 
con el tiempo. 





Giz) 


Figura 4-31 Sistema estable en tiempo discreto lineal e invariante con el tiempo. 


La señal muestreada u(kT) es 
u(kT) = senkwT 


La transformada z de la entrada muestreada es 


> z senwT 
U(z) = Z [senkwT] = EDGE 


La respuesta del sistema está dada por 





z sen wT 
X(z) = G(z)U(z) = COEN e 
a = jale ==. + [término debido a los polos de G(z)] (4-34) 


Al multiplicar ambos miembros de la ecuación (4-34) por (z — e/”)/z, obtenemos 


a jwT jT 

senwT alz — e” Zoe! S : 

G(z) ar a t tn 5 2 + 4—~ [término debido a los polos de G(2)] 
et Zee z 

El segundo término del segundo miembro de esta última ecuación se acerca a cero conforme z se 

acerca a e””. Dado que el sistema considerado aquí es estable, el tercer término del segundo miem- 

bro también se acerca a cero conforme z se acerca a e”. Por lo tanto, al dejar que z se acerque a e”. 


tenemos 





joT 
a= ca), eT > 
El coeficiente 4, que es el complejo conjugado de a, se obtiene como sigue: 
E 
2j 
Definamos 
G(e”T) = Me” 
Entonces 


Glee) = Me™ 

La ecuación (4-34) ahora puede escribirse como 
Me z  _ Me” 4 
2 z= gMt 2j z-e 





X(z) = + [término debido a los polos de G(2)] 


-jwT 
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o bien 





x= A e?z ePz 
(2) 77; z= eT ar a eT 


> ) + [término debido a los polos de G(2)] 


La transformada z inversa de esta última ecuación es 
Mo, l 
x(kT) = 2 (e° ei? — ¿HT eit) + Z~ [término debido a los polos de G(z)] (4-35) 


El último término del segundo miembro de la ecuación (4-35) representa la respuesta transitoria. 
Dado que el sistema G(z) se ha supuesto estable, todos los términos de la respuesta transitoria des- 
aparecerán en estado permanente y obtendremos la siguiente respuesta en estado permanente x (ATY: 


xs (KT) = q en — eTo] = M sen(kwT + 8) (4-36) 


donde M, que es la ganancia del sistema en tiempo discreto al ser sujeto a una entrada senoidal, está 
dada por 


M = M(u) = [G(e/””)| 
y 0, el ángulo de fase, está dado por 


0 = (w) =/G(e”") 
En términos de G(e*””), se puede escribir la ecuación (4-36) como sigue: 
xs (KT) = |G(el””)|sen(kwT + /G(e"0) 


Hemos demostrado que G(e”*”) realmente proporciona la magnitud de la fase de la respuesta en 
frecuencia de G(z). Por lo tanto, para obtener la respuesta en frecuencia de G(z), sólo necesitamos 
escribir e en lugar de z en G(z). La función G(e”%) se conoce comúnmente como función de 
transferencia pulso senoidal. Si observamos que 


eNo+QwT)T = gjoT pj = gioT 


encontramos que la función de transferencia pulso senoidal G(e'*”) es periódica, con un período = T. 


Ejemplo 4-10 
Considere el sistema definido por 
x(kT) = u(kT) + ax((k — DD, 0<a<1 
donde u(kT) es la entrada y x(kT) la salida. Obtenga la salida en estado permanente x(A7) cuando la 


entrada u(kT) es la senoidal de muestra, es decir u(kT) = A sen kwT. 
La transformada z de la ecuación del sistema es 


X(z) = U(z) + az *X(2) 
Al definir G(z) = X(2)/U(2), tenemos 


X(2) _ 1 
U(z) 1-az"* 





G(z) = 
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Sustituyamos z por e” en G(z). De ahí se puede obtener la función de transferencia pulso senoidal 
G(e*") en la forma 


1 1 


oT 1 —acoswT + jasenwT 


joTy = 
Ger 1 — ae 





La amplitud de G(e'*) es 


(Gte) = M 





E 1 
V1 + a? -— 2a coswT 


y el ángulo de fase de G(e™") es 


asenwT 


/[Gle'”) =0= -tan a o GT 
Entonces, la salida en estado permanente x,,(k7) se puede escribir como sigue: 
Xs(kT) = AM sin(kwT + 8) 
A 
VI + a? ~ 2a cos oT 











so kar tan —E suf ) 


1 ~ a cosoT 


Transformación bilineal y el plano w. Antes de aplicar con ventaja los métodos bien desa- 
rrollados de la respuesta en frecuencia al análisis y diseño de sistemas de control en tiempo discreto, 
son necesarias ciertas modificaciones al método del plano z. Dado que en el plano z la frecuencia 
aparece en la forma z = e””, si tratamos la respuesta en frecuencia del plano z, la simplicidad de las 
trazas logarítmicos se perderá totalmente. Por lo tanto, la aplicación directa de los métodos de res- 
puesta en frecuencia no merece tomarse en consideración. De hecho, en vista de que la transformada 
z transforma las franjas primarias y complementarias en el semiplano izquierdo del plano s al círculo 
unitario del plano z, los métodos convencionales de la respuesta en frecuencia, que se ocupan de la 
totalidad del semiplano izquierdo del plano, no se aplican al plano z. 

La dificultad, sin embargo, puede resolverse transformando la función de transferencia pulso 
en el plano z en la correspondiente en el plano w. La transformada llamada comúnmente transforma- 
da w, es decir una transformada bilineal, queda definida por 


E 1 + (T/2)w 

1 — (T/2)w 

donde T es el período de muestreo involucrado en el sistema de control en tiempo discreto bajo 

consideración. Al convertir una función de transferencia pulso dada en el plano z en una función 

racional de w, se pueden extender los métodos de respuesta en frecuencia a los sistemas de control en 
tiempo discreto. Si se resuelve la ecuación (4-37) en función de w, obtenemos la relación inversa 

aio 2z-1 

Tzw+l1 


(4-37) 





(4-38) 


Mediante la transformada z y la transformada w, la franja primaria del semiplano izquierdo del 
plano s es primero transformada al interior del circulo unitario en el plano z y a continuación trans- 
formada a la totalidad del semiplano izquierdo del plano w. Estos dos procesos de correspondencia 
se ilustran en la figura 4-32. (Note que en el plano s únicamente consideramos la franja primaria.) 
Observe que el origen del plano z corresponde al punto w = —-2/T en el plano w. También note que, 


conforme s varía desde cero hasta jcw,/2 a lo largo del eje je en el plano s, z varía desde I hasta —1 a 
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A Plano w 









im 


Re 








a) b) c) 


Figura 4-32 Diagramas que muestran las correspondencias del plano s con el plano z y del plano z con el plano w. 
a) Franja primaria en el semiplano izquierdo del plano s; b) correspondencia en el plano z de la franja primaria en el 
plano s; c) correspondencia en el plano w del círculo unitario en el plano z. 


lo largo del círculo unitario en el plano z y w varía desde 0 hasta œ en el eje imaginario del 
plano w. 

A pesar de que el semiplano izquierdo del plano w corresponde al semiplano izquierdo del 
plano s y que el eje imaginario del plano w corresponde al eje imaginario del plano s, existen diferen- 
cias entre ambos planos. La diferencia principal es que el comportamiento en el plano s sobre el 
intervalo de frecuencia —+ w, € w £ œ, corresponde al intervalo —œ < v < œ, donde v es la frecuencia 
ficticia en el plano w. Esto significa que, a pesar de que las características de la respuesta en frecuen- 
cia del filtro analógico serán reproducidas en el filtro discreto o digital, la escala de frecuencias en la 
cual se presenta la respuesta se comprimirá de un intervalo infinito en el filtro analógico a un inter- 
valo finito en el filtro digital. 

Una vez que la función de transferencia pulso G(z) haya sido transformada en G(w) mediante 
la transformada w, podrá ser tratada como una función transferencia convencional en w. Se podrán 
utilizar las técnicas convencionales de respuesta en frecuencia en el plano w y, por lo tanto, podrán 
aplicarse las técnicas bien establecidas de diseño mediante la respuesta en frecuencia al diseño de los 
sistemas de control en tiempo discreto. 

Como se observó antes, y representa la frecuencia ficticia. Al reemplazar w por jv se pueden 
usar técnicas convencionales de respuesta en frecuencia para dibujar el diagrama Bode correspon- 
diente a la función de transferencia en w. (En la breve revisión de los Bode en esta sección, utilizare- 
mos la frecuencia ficticia v como variable.) 

Aunque el plano w se parece geométricamente al plano s, el eje de frecuencias en el plano w 
está distorsionado. La frecuencia ficticia v y la frecuencia real w están relacionadas como sigue: 


jv = o 
w=jv Tz+lleer  TeT41 
2 eLUYoT _ ¿riU2jT 2 


= = — 555 = L j tan 
¡DT KoT J 
T fiww.Fréelibros.m 2 


AE! 7 | 
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es decir, 


2 wT 
y = tan (4-39) 
La ecuación (4-39) da la relación entre la frecuencia real w y la frecuencia ficticia v. Note que 
conforme la frecuencia real w pasa de —+ w, hasta O la frecuencia ficticia w pasa desde —x hasta 0, y 
conforme w pasa de 0 hasta +w, v pasa desde O hasta ~. 
Refiriéndose a la ecuación (4-39), la frecuencia real w se puede traducir a la frecuencia ficticia 
v. Por ejemplo,si el ancho de franja se especifica como wp, entonces el ancho de franja correspon- 
diente al plano w es (2/7) tan (w,7/2). De igual manera, G(/v,) corresponde a G(¡w,), donde w, = (2/ 
T) tan? (1,7/2). En la figura 4-33 se da la relación entre la frecuencia ficticia v multiplicada por +7 
y la frecuencia real œw del rango de frecuencias entre 0 y + w, 
Observe que en la ecuación (4-39), si wT es pequeño, entonces 


VE 


Esto significa que para un wT pequeño las funciones de transferencia G(s) y G(w) se parecen una a 
la otra. Observe que éste es el resultado directo de la inclusión del factor de escala 2/T en la ecuación 
(4-38). La presencia de este factor de escala en la transformación nos permite mantener las mismas 
constantes de error antes y después de la transformación en w. (Esto significa que la función de 
transferencia en el plano w se acercará a la del plano s conforme T se acerque a 0. Vea el ejemplo 4- 
11 a continuación.) 


Ejemplo 4-11 
Considere la función de transferencia del sistema que se muestra en la figura 4-34. El período de muestreo 
T se supone de 0.1 seg. Obtenga G(w). 
La transformada z de G(s) es 





T 
ER 
2 

6 

5 

4 f- 

3 

2 

l 
1 
Figura 4-33 Relación entre la frecuencia ficticia v 
0 s “ multiplicada por +7 y la frecuencia real w para el intervalo 


nE 


de frecuencias entre 0 y + %,. 
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a 
G(s) 
Figura 4-34 Función de transferencia del sistema del ejemplo 4-11. 


G(z) -z| 10 | 





Ss s+10 
=a- 
US la +10) 
_ 0.6321 
z — 0.3679 


Mediante la transformación bilineal dada por la ecuación (4-37), es decir, 


_ 1+ (T/2)w _1+0.05w 
1- (T/2)w  1-0.05w 


G(z) puede ser transformada en G(w) como sigue: 


Ea 0.6321 _ 0.6321(1 — 0.05w) 
0) =P 0:05w — 03679 0-6321 + 0.06840w 
1-0.05w ` 
1 — 0.05w 
= 9.2M 941 


Observe que la localización del polo de la planta es s =—10 y que el polo en el plano w es w = — 
9.241. El valor de ganancia en el plano s es 10 y el correspondiente en el plano w es 9.241. (Así, tanto las 
localizaciones de los polos como los valores de ganancia son similares en el plano s y en el plano w.) Sin 
embargo, G(w) tiene un cero en w = 2/T = 20, a pesar de que la planta no tiene ningún cero. Conforme se 
hace más pequeño el periodo de muestreo T, el cero del plano w en w = 2/T se acerca a % en el semiplano 
derecho del plano w. Observe que tenemos 





En, 060) = imi 


Este hecho es muy útil para verificar los cálculos numéricos para la transformación de G(s) en G(w). 


Para resumir, la transformada w, transformada bilineal, hace corresponder el interior del círcu- 
lo unitario del plano z con el semiplano izquierdo del plano w. El resultado general de las transforma- 
ciones del plano s en el plano z y en el plano w es que el plano w y el plano s son similares sobre las 
regiones de interés del plano s. Esto es debido a que algunas de las distorsiones causadas por la 
transformación del plano s en el plano z están parcialmente compensadas por la transformación del 
plano z en el plano w. 

Observe que si 


boz” + biz™! + ->> + bm 


Glz) z” + az +e +a 


>, msn 


donde las a, y las b; son constantes, se transforma en el plano w mediante la transformación 
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_1+(T7/2)w 
¿e (2) 


entonces, G(w) asume la forma 


E). EA + Ba 
aow” + ayw! + a + An 


donde las a; y las 8, son constantes (algunas de ellas pueden ser 0). Entonces, G(w) es un cociente de 
polinomios en w, donde los grados del numerador o del denominador pueden ser o no iguales, Dado 
que G(¡v) es una función racional de v, se puede aplicar el criterio de estabilidad de Nyquist a G(¡»). 
En términos del diagrama Bode, se aplican a G(¡v) la aproximación convencional de línea recta a la 
curva de magnitud, así como el concepto del margen de fase y el margen de ganancia. 


Diagramas Bode. En los sistemas de control en tiempo continuo de una entrada-una salida 
se ha utilizado mucho el diseño mediante diagramas Bode. En particular, si la función de transferen- 
cia está en forma factorizada, es bien conocida la simplicidad y rapidez con la cual se puede dibujar 
y reformar un diagrama Bode asintótico. 

Tal y como se indicó antes, los métodos convencionales de respuesta en frecuencia se aplican 
a las funciones de transferencia en el plano w. Recuerde que el diagrama Bode consiste en dos trazas 
por separado, la magnitud logarítmica |G(jv)| en función del logaritmo de v y el ángulo de fase G(¡v) 
en función del logaritmo de ». La traza de la magnitud logarítmica se basa en la factorización de 
G(¡v), de tal forma que funciona en el principio de sumar los términos individuales factorizados, en 
vez de multiplicar los términos individuales. Las técnicas conocidas de trazas asintóticas son aplica- 
bles y, por lo tanto, se puede dibujar con rapidez la curva de magnitud si se utilizan asíntotas con 
líneas rectas. Mediante el uso del diagrama Bode, se puede diseñar un compensador digital o un 
controlador digital a través de técnicas de diseño convencionales. 

Es importante notar que puede existir una diferencia en las magnitudes en alta frecuencia para 
G(¡w) y Gv). La asintota de alta frecuencia de la curva de magnitud logarítmica para G(¡v) puede 
ser una línea constante a ciertos decibeles (que es lo mismo que una línea horizontal). Por otra parte. 
si lím, _, .. G(s) = 0, entonces la magnitud de G(¡w) siempre se acercará a cero (-xdB) conforme w se 
acerque a infinito. Por ejemplo, en relación con el ejemplo 4-11, obtuvimos G(w) para G(s) como 
sigue: 





1 - E 


PoS 0212 + 9.241 
La magnitud en alta frecuencia de G(¡v) es 

1 — 0.05jv 
jv + 9.241 


en tanto que la magnitud en alta frecuencia de la planta es 


lim |G(jv)| = lim 9.241 ] = 0.4621 


lim 


Xx 





10 
== =0 
jo +10 
La diferencia en los diagramas Bode en el extremo de alta frecuencia puede explicarse como sigue: 
primero, recuerde que sólo estamos interesados en el rango de frecuencia 0 < w < + w, lo que corres- 
ponde a 0 < v < œ. Entonces, al observar que v =% en el plano w corresponde a w= +w, en el plano 


s, se puede decir que lim, _, . [G(¡v)| corresponde a lím,, ., w2 110/(/w + 10)|, que es una constante. (Es 
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importante señalar que estos dos valores no suelen ser iguales entre sí.) Desde el punto de vista de 
polos y ceros, se puede decir que cuando |G(/v)]| es una constante distinta de cero en v = œ, está 
implícito que G(w) contiene el mismo número de polos y de ceros. 

En general, uno o más ceros de G(w) se presentan en el semiplano derecho del plano w. La 
presencia de un cero en el semiplano derecho del plano w significa que G(w) es una función de 
transferencia de fase no mínima. Por lo tanto, debemos tener cuidado al dibujar la curva de ángulo de 
fase en el diagrama Bode. 


Ventajas del método del diagrama Bode para el diseño, El método del diagrama Bode es en 
particular útil en lo que se refiere al análisis y el diseño de los sistemas de control, por las siguientes 
razones: 


1. Enel diagrama Bode, la asíntota de baja frecuencia de la curva de magnitud indica una de las 
constantes de error estáticas K,, K, 0 Ka 

2. Se pueden traducir las especificaciones de la respuesta transitoria a las correspondientes de la 
respuesta en frecuencia en términos del margen de fase, del margen de ganancia, del ancho de 
franja y así sucesivamente. Estas especificaciones se pueden manejar fácilmente en el diagrama 
Bode. En particular, los márgenes de fase y de ganancia se pueden leer en forma directa del 
diagrama Bode. 

3. El diseño de un compensador digital (o un controlador digital) para satisfacer las especifica- 
ciones dadas (en función del margen de fase o del margen de ganancia) puede llevarse a cabo 
en el diagrama Bode de una forma sencilla y simple. 


Compensación de adelanto de fase, atraso de fase y atraso-adelanto de fase. Antes de que 
analicemos los procedimientos de diseño en el plano w, revisemos las técnicas de compensación 
mediante el adelanto de fase, el atraso de fase y el atraso-adelanto de fase. 

La compensación mediante el adelanto de fase es comúnmente utilizada para mejorar los már- 
genes de estabilidad. Este tipo de compensación aumenta el ancho de franja del sistema. Por lo tanto, 
el sistema tiene más velocidad para responder. Sin embargo, un sistema que utilice compensación 
mediante adelanto de fase puede estar sujeto a problemas de ruido de alta frecuencia, en vista de su 
incremento en la ganancia en alta frecuencia, 

La compensación mediante atraso de fase reduce la ganancia del sistema en frecuencias más 
altas, sin reducir la ganancia del sistema en frecuencias más bajas. El ancho de franja del sistema 
queda reducido y, por lo tanto, el sistema tiene una velocidad de respuesta más baja. Debido a la 
reducida ganancia en alta frecuencia, se puede aumentar la ganancia total del sistema y, por lo tanto, 
incrementarse la ganancia en baja frecuencia y mejorarse la precisión en estado permanente. Tam- 
bién puede atenuarse cualquier ruido de alta frecuencia que se presente en el sistema. 

En algunas aplicaciones, un compensador de atraso de fase es colocado en cascada con un 
compensador de adelanto de fase. Un compensador en cascada como éste se conoce como un compen- 
sador de atraso-adelanto de fase. Al utilizar un compensador de atraso-adelanto se puede incrementar 
la ganancia en baja frecuencia (lo que significa una mejoría en la precisión en estado permanente), 
mientras que al mismo tiempo se puede aumentar el ancho de franja y los márgenes de estabilidad. 

Observe que el controlador PID es un caso especial de controlador de atraso-adelanto de fase. 
La acción del control PD, que afecta la región de alta frecuencia, aumenta el ángulo del adelanto de 
fase y mejora la estabilidad del sistema, así como también incrementa el ancho de banda del sistema 
(lo que mejora la velocidad de respuesta). Esto es, el controlador PD se comporta de una manera 
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similar al compensador de adelanto de fase. La acción de control PI afecta la parte de baja frecuencia 
y, de hecho, aumenta la ganancia en baja frecuencia al mejorar la precisión en estado permanente. 
Por lo tanto, el controlador PI actúa como un compensador de atraso de fase. La acción de control 
PID es una combinación de las acciones de control PI y PD. Las técnicas de diseño para los 
controladores PID básicamente siguen los correspondientes a los compensadores de atraso-adelanto 
de fase. (En los sistemas de control industrial, sin embargo, cada acción de control PID en el 
controlador PID puede ser ajustada en forma experimental.) 


Algunas observaciones sobre el problema de cuantización de los coeficientes. Desde el 
punto de vista de la implementación en un microprocesador de los compensadores de adelanto de 
fase, atraso de fase y atraso-adelanto de fase, los compensadores de adelanto de fase no presentan 
problemas de cuantización de los coeficientes, porque las localizaciones de los polos y de los ceros 
están bien separadas. Sin embargo, en el caso de los compensadores de atraso de fase y de los 
compensadores de atraso-adelanto de fase, la red de atraso de fase plantea un problema de cuantización 
de los coeficientes porque las localizaciones de polos y de ceros están cercanas entre sí. (Están cerca 
del punto z = 1.) 

Dado que los coeficientes de filtro deben realizarse mediante palabras binarias que utilizan un 
número limitado de bits, si el número de bits empleados no es suficiente, las localizaciones de los 
polos y los ceros del filtro pudieran no llevarse a cabo con tanta exactitud como se desea y el filtro 
resultante no se comportará como se espera. 

Debido a que pequeñas desviaciones en las localizaciones de polos y de ceros en relación con 
las localizaciones deseadas pueden tener efectos significativos en las características de la respuesta 
en frecuencia del compensador, la versión digital del compensador pudiera no funcionar como se 
espera. Para minimizar el efecto del problema de cuantización de los coeficientes, es necesario 
estructurar el filtro de tal forma que resulte lo menos sujeto posible a inexactitudes de coeficientes 
debidas a la cuantización. 

En razón de la sensibilidad de las raíces de los polinomios a las variaciones de los parámetros 
que se vuelven más severos conforme aumenta el orden del polinomio, la realización directa de un 


orden superior no es deseable. Es preferible colocar elementos de orden inferior en cascada o en. 
paralelo, tal y como se analiza en la sección 3-6. Si desde el inicio seleccionamos polos y ceros desde ; 


el compensador digital a partir de puntos discretos permisibles, se puede evitar el problema de 
cuantización de los coeficientes. 

En el compensador analógico, los polos y los ceros del compensador pueden colocarse con 
una precisión arbitraria. En la conversión de un compensador analógico a uno digital, la versión 
digital del compensador de atraso puede tener imprecisiones considerables en las localizaciones de 
los polos y de los ceros. (Lo que es importante recordar es que los polos y los ceros en el filtro en el 
plano z deben presentarse en un número finito de puntos discretos permisibles.) 


Procedimiento de diseño en el plano w. Refiriéndonos al sistema de control digital que se 
muestra en la figura 4-35, el procedimiento de diseño en el plano w puede enunciarse como sigue: 


1. Primero obtenga G(2), la transformada z de la planta precedida por un retén. A continuación 
transforme G(z) en una función de transferencia G(w) mediante la transformación bilineal 
dada por la ecuación (4-37): 

_14+(7/2)w 
2 1= (12) 
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Figura 4-35 Sistema de control digital. 


Esto es, 


G(w) = Glz Me +(7/2)w/11-(7/2)w] 


Es importante que se seleccione adecuadamente el período de muestreo 7. Una regla práctica 
es muestrea con una frecuencia de 10 veces el ancho de franja del sistema en lazo cerrado. 
(Aunque los controles digitales y el procesamiento de señales utilizan procedimientos simila- 
res en el muestreo en las señales en tiempo continuo, las frecuencias de muestreo involucradas 
son muy distintas. En el campo de procesamiento de señales, las frecuencias de muestreo por 
lo general son muy altas, en tanto que en el campo de los sistemas de control digital, las 
frecuencias de muestreo usadas son por lo regular bajas. Esta diferencia en las frecuencias de 
muestreo se debe en principio a las distintas dinámicas involucradas y a las ventajas y desven- 
tajas existentes en ambos campos.) 

Sustituya w = jv en G(w) y trace el diagrama Bode para G(¡v). 

3. Lea del diagrama Bode las constantes de error estático, el margen de fase y el margen de 
ganancia. 

4. Suponiendo que la ganancia en baja frecuencia de la función de transferencia del controlador 
en tiempo discreto (o controlador digital) G,(w) es la unidad, determine la ganancia del siste- 
ma al satisfacer el requisito para una constante dada de error estático. A continuación, utilizan- 
do técnicas de diseño convencionales para sistema de control en tiempo continuo, determine 
los polos y los ceros de la función de transferencia del controlador digital. [G,,(w) es un co- 
ciente de dos polinomios en w.] Entonces la función de transferencia en lazo abierto del siste- 
ma diseñado está dado por G,(w)G(w). 

5. Transforme la función de transferencia del controlador G,(w) en G,(z) mediante la transfor- 
mación bilineal dada por la ecuación (4-38) 


Lao 


2271 
Tz+1 





Entonces 


Gp(2) = Go(W).=ame-0e+1) 


es la función de transferencia pulso del controlador digital. 
6. Lleve a cabo la función de transferencia pulso G,,(z) mediante un algoritmo de cálculo, 


Siguiendo el procedimiento de diseño que acabamos de proporcionar, es importante observar 
lo siguiente: 
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1. La función de transferencia G(w) es una función de transferencia de fase no mínima. Por la 
tanto, la curva del ángulo de fase es distinta de la correspondiente a la función de transferencia 
de fase mínima más típica. Es necesario asegurarse de que la curva del ángulo de fase quede 
bien dibujada tomando en consideración el término de fase no mínimo. 

2. El eje de frecuencia en el plano w está distorsionado. La relación entre la frecuencia ficticia 7 
y la frecuencia real w es 


2 wT 
v = = tan- 


T 2 


Si, por ejemplo, se define un ancho de franja w, necesitamos diseñar el sistema para un ancho 
de franja v,, donde 


V E DEE 
a 2 


Ejemplo 4-12 
Considere el sistema de control digital que se muestra en la figura 4-36. Diseñe un controlador digital en 
el plano w de tal forma que el margen de fase sea 50°, el margen de ganancia sea de por lo menos 10 dB. 
y la constante de error de velocidad estática K, sea 2 seg"', Suponga que el período de muestreo es 0.2 
segundos, es decir, que 7 = 0.2, 
Primero obtenemos la función de transferencia pulso G(z) de la planta que está precedida por un 


retenedor de orden cero: 
|l- e” K 
GC) -z| s s(s + 5] 


K 
ala == 
ERA zla; + 5| 
K(z + 0.9356) 
(z — 1)(z - 0.8187) 
_ K(0.01873z + 0.01752) 
2? — 1.8187z + 0.8187 
A continuación, transformamos la función de transferencia pulso G(z) en una función de transfe- 
rencia G(w) mediante la transformación bilineal dada por la ecuación (4-37): 
_1+(7/2)w _1+0.1w 
1 -— (T/2)w 1-0.lw 


= 0.01875| 








K c(t} 
sis +1) ciz) 








Figura 4-36 Sistema de control digital del ejemplo 4-12. 
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Entonces, 
K| o.01873 221%) + 0.01752 
1—0.iw 
PAOS nw a a L a 
(oe) - 181874024) + 0.8187 
_ K(0.000333w* — 0.09633w + 0.9966) 
w° + 0,9969w 
w w 
deai 
Ñ w(w + 1) 


Un compensador simple de adelanto de fase probablemente satisfará todos los requisitos. Por lo 
tanto, probaremos compensación mediante adelanto. (Si la compensación mediante adelanto no satisface 
todos los requisitos, será menester utilizar un tipo distinto de compensación.) 

Ahora supongamos que la función de transferencia del controlador digital G,(w) tiene una ganan- 
cia unitaria para el intervalo de baja frecuencia y tiene la forma siguiente: 

1>+7w 
Gr(W) = H-—, 0O<a<1 
p(w) 1 + arw 
(Se trata de un compensador de atraso de fase.) Ésta es una de las formas más sencillas de la función de 
transferencia del controlador digital. (Otras formas se pueden suponer también para este problema.) La 
función de transferencia en lazo abierto es 


1 + rw K(-0.000333w* — 0.09633w + 0.9966) 


GAWG(W = Tr w° + 0.9969w 


La constante de error de velocidad estática K, queda especificada como 2 seg”. Por lo tanto, 
K, = lim wGp(w)G(w) = K = 2 
w—0 


La ganancia K se determina entonces como el valor 2. 
Al definir K =2, trazamos el diagrama Bode de G(w): 


_ 2(—0.000333w* — 0.09633w + 0.9966) 








Gw) w? + 0.9969w 
w w 
ESE 
f w(w + 1) 


La figura 4-37 muestra el diagrama Bode para el sistema. Para las curvas de magnitud hemos 
utilizado asíntotas con líneas rectas. La magnitud y el ángulo de fase de G(jv) aparecen como curvas 
punteadas. (Note que el cero en v= 10 que ocurre en el semiplano derecho del plano w da retraso de fase.) 
El margen de fase se puede leer del diagrama Bode (curvas punteadas) como 30° y el margen de ganancia 
como 14.5 dB. 

Las especificaciones requieren, además de K, = 2, de un margen de fase de 50° y una ganancia de 
por lo menos 10 dB. Diseñemos un controlador digital que satisfaga estas especificaciones. 


Diseño del compensador de adelanto. Ya que las especificaciones exigen un margen de fase de 
50°, el ángulo adicional del adelanto de fase necesario para satisfacer este requisito es de 20%. Para 
obtener un margen de fase de 50° sin reducir el valor de K, el compensador de adelanto debe de contribuir 
el ángulo de adelanto de fase requerido. 


www.FreeLibros.me 


238 





Diseño de sistemas de control en tiempo discreto mediante métodos convencionales Capítulo £ 




































































v (rad/sec) 


Figura 4-37 Diagrama Bode para el sistema diseñado en el ejemplo 4-12. 


Si observamos que la adición de un compensador de adelanto modifica la curva de magnitud en el 
diagrama Bode, la frecuencia de cruce de ganancia se desplazará hacia la derecha. Si se considera el 
corrimiento de la ganancia en la frecuencia de cruce, debemos suponer que @m, que es el ángulo máximo 
de adelanto de fase requerido, es aproximadamente de 28”. (Esto significa que se han añadido 8° para 
compensar el corrimiento de la ganancia en la frecuencia de cruce.) En vista de que 


l-a 
l+a 





Sen Ọm = 


Pm = 28° corresponde a a = 0.361. 
Una vez que el factor œ de atenuación se ha determinado sobre la base del ángulo de adelanto de 
fase requerido, el siguiente paso es determinar las frecuencias de esquina v = 1/7 y v = l/(ar) del 
compensador de adelanto. Para ello, primero notamos que el ángulo de adelanto de fase máximo d,, se 
presenta en la media geométrica de las dos frecuencias de esquina, es decir v = 1/ (Var ). La cantidad de 
modificación en la curva de magnitud en v = (Jar) debido a la inclusión del término (1 + TjwYU + 
aTjv) es 
1 + rjv 


1 
v=1(Var) Va 


A continuación encontramos el punto de frecuencia donde la magnitud del sistema no compensa- 
do es =-20 log(1//a ). Note que 





1 + arjv 





loa —20 log 1.6643 = -4.425 dB 


—20 lo = 
EV0361 
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Para encontrar el punto de frecuencia donde la magnitud es 4.425 dB, sustituimos w = jy en G(w) y 
encontramos la magnitud de G(v): 


[G(j»)| = 


Mediante prueba y error, encontramos que en v = 1.7 la magnitud se convierte en alrededor de 4.4 dB. 
Seleccionamos esta frecuencia como la nueva frecuencia de cruce de ganancia »,. Al observar que esta 
frecuencia corresponde a l/(Yar ), o 





1 
e = =1.7 
á Var 
obtenemos 
T= =o = 0.9790 
17Va ` 
y 
ar = 0.3534 


Por lo tanto, el compensador de adelanto determinado esa 


1+ rw _ 1+ 0.9790w 
l +armw  1+0.3534w 


Las curvas de magnitud y de ángulo de fase para Gp(jv) y las curvas de magnitud y de ángulo de fase de 
la función de transferencia en lazo abierto compensada G,(/1)G(¡v) se muestran mediante curvas sólidas 
en la figura 4-37. Del diagrama Bode vemos que el margen de fase es 50? y el margen de ganancia es 14 
dB. 


Gp(w) = (4-40) 


La función de transferencia del controlador dada por la ecuación (4-40) se transformará ahora de 
regreso al plano z mediante la transformación bilineal dada por la ecuación (4-38): 

e a EO a 1 

02z+1 9 z2+1 


+ 


N 
m 
N 











Y] 
N 
m 


Entonces, 





+1 


Golz) = z=] 
1+ 0.3534 107 i | 


_ 2.3798z — 1.9387 
~ z — 0.5589 
La función de transferencia pulso en lazo abierto del sistema compensado es 
2.3798z — 1.9387 0.03746(z + 0.9356) 
z — 0.5589 (z — 1)(z — 0.8187) 
_ 0.08912? + 0.0108z — 0.0679 
~ z* — 2.37762* + 1.8352z — 0.4576 


1 + 097601057") 





G»(z)G(z) = 
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La función de transferencia pulso en lazo cerrado del sistema que hemos diseñado es 


C(z) z 0.08912* + 0.0108z — 0.0679 
R(z) 2? — 2.28852? + 1.8460z — 0.5255 


0.0891(z + 0.9357)(z — 0.8145) 
(z — 0.8126X(z — 0.7379 — j0.3196)(z — 0.7379 + j0.3196) 


Observe que la función de transferencia pulso en lazo cerrado implica dos ceros localizados en z = — 
0.9357 y z = 0.8145. El cero en z = 0.8145 prácticamente se cancela con el polo en lazo cerrado en z = 
0.8126. El efecto de otro cero en z = -0,9357 sobre las respuestas transitorias y en frecuencia es mus 
pequeño, ya que está localizado en el eje real negativo del plano z entre 0 y —1 y es cercano al punto z = 
—1. El par de polos complejos conjugados actúan como polos dominantes en lazo cerrado. (El sistema se 
comporta como si se tratara de un sistema de segundo orden.) 

Para verificar la respuesta transitoria del sistema diseñado, obtendremos una respuesta escalón 
unitario de este sistema utilizando MATLAB. El programa 4-2 de MATLAB produce la curva de res- 
puesta escalón unitario tal y como se observa en la figura 4-38. La gráfica de la respuesta escalón unitario 
muestra un sobrepaso máximo de alrededor de 20% y un tiempo de levantamiento de aproximadamente 
4 seg. De esta curva podemos observar que el número de muestras por ciclo de la oscilación senoidal es 
aproximadamente 15. Esto significa que la frecuencia de muestreo w, es 15 veces la frecuencia naturai 
amortiguada w,. Por lo tanto, el período de muestreo de 0.2 seg es satisfactorio en este sistema bajo 
operación normal. 








E A A A A A A A A 
MATLAB Programa 4-2 


__— _—_—__—_—_— — A 2 


%- Unit-step response of designed system -—-—--- 





num=[0 0.0891 0.0108 -0.0679); 
den=|[1 -2.2885 1.8460 -0.5255); 


r = ones{1,41); 

v=[0 40 0 1.6); 
axis(v); 

k = 0:40; 

c = filter(num,den,r); 
plot(k,c,'o”) 

grid 


title('Unit-Step Response cf Designed System”) 
xlebel('k (Sampling period T = 0.2 sec)') 
yleb('Output c(k)”) 











Comentarios. La ventaja del método de transformada de w es que el método de respuesta en 


frecuencia convencional mediante el uso de diagramas Bode puede ser utilizado para diseños de 
sistemas de control en tiempo discreto. En la aplicación de este método, debemos seleccionar cuida- 
dosamente una frecuencia de muestreo razonable. Antes de concluir esta sección, resumiremos los 
puntos importantes relativos al diseño en el plano w. 


La magnitud y el ángulo de fase de G(/v) son la magnitud y el ángulo de fase de G(z) conforme 
z se mueve en el círculo unitario desde z = 1 hasta z = —1. En vista de que z = e””, el valor w 
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Respuesta escalón unitario del sistema diseñado 
1.6 — — SES —=— — — = -ay 














1.4} a 1 74 
1.2) TN era a ha l 
o o 
o 
1H- o ooy ooo 00000000000090 004 
g osho o a a 
B 
3 
0.6) so desa 
o 
0.4t . J 
o 
0.2+ z - d 
o 
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k (Período de muestreo T = 0.2 seg) 


Figura 4-38 Gráfica de la respuesta escalón unitario del sistema diseñado. 


varía desde 0 hasta + œ, La frecuencia ficticia v varía desde 0 hasta æ% ya que v = (2/7) tan(wT/ 
2). Por lo tanto, la respuesta en frecuencia del sistema de control digital para 0 < w < +0, es 
similar a la respuesta en frecuencia del sistema de control analógico correspondiente en el caso 
de 0<v<x, 
Dado que G(¡v) es una función racional de v, básicamente es la misma que G(¡«w). En la deter- 
minación de ceros inestables posibles de la ecuación característica, se puede aplicar el criterio 
de estabilidad de Nyquist. Por lo tanto, son aplicables a G(¡v) tanto la aproximación conven- 
cional con líneas rectas a la curva de magnitud del diagrama Bode como el concepto de mar- 
gen de fase y de margen de ganancia. 
Compare las funciones de transferencia G(w) y G(s). Como hemos mencionado antes, en ra- 
zón de la presencia del factor de escala 2/T en la transformación w, las constantes de error 
estático correspondientes para G(w) y para G(s) se hacen idénticas. (Sin el factor de escala 2/ 
T esto no sería cierto.) 
La transformación w puede generar uno o más ceros en el semiplano derecho en G(w). Si 
existen uno o más ceros en el semiplano derecho, entonces G(w) es una función de transferen- 
cia de fase no mínima. Debido a que los ceros en el semiplano derecho están generados por la 
operación de muestreo y retención, las localizaciones de estos ceros dependen del período de 
muestreo 7. Los efectos de estos ceros en el semiplano derecho en la respuesta se hacen meno- 
res conforme se reduce el período de muestreo 7. 

Ahora consideremos los efectos de la respuesta del cero en el semiplano derecho en w = 
2/T. El cero en w = 2/7 genera distorsión en la respuesta en frecuencia conforme v se acerca a 
2/T. En vista de que 

2 wT 
v = = tany 


T 2 
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entonces, conforme v se acerca a 2/7, tan(w7/2) se aproxima a 1, o bien 


T_T 
2 4 
y, por lo tanto, 
E, 
SEIT 


Como ya se indicó, w = 4w, = T/T es la frecuencia más alta que consideramos en la respuesta 
del sistema de control en tiempo discreto o digital. Por lo tanto, w = w/4 = 11/27, que es la 
mitad de la frecuencia más alta considerada, está dentro del intervalo de frecuencia de interés. 
Así, el cero en w = 2/T, que aparece en el semiplano derecho del plano w, afectará seriamente 
la respuesta. 

5. Debe hacerse notar que el método de diagrama Bode en el plano w se utiliza con frecuencia, y 
muchos sistemas de control digital de éxito han sido diseñados mediante este procedimiento. 


4-7 MÉTODO DE DISEÑO ANALÍTICO 


La razón principal por la cual el manejo de los controladores analógicos es limitado, se debe a que 
los componentes neumáticos, hidráulicos y electrónicos tienen limitaciones físicas. Dichas limita- 
ciones pueden ignorarse por completo en el diseño de los controladores digitales. Por lo tanto, mu- 
chos esquemas de control, que han sido imposibles con controles analógicos, resultan posibles con 
controles digitales. De hecho, esquemas de control óptimo que son imposibles mediante controladores 
analógicos se han hecho posibles con esquemas de control digital. 

En esta sección presentamos en particular un método de diseño analítico para controladores 
digitales que obligará la secuencia de error, cuando quede sujeta a un tipo específico de entrada en el 
dominio del tiempo, para llegar a cero después de un número finito de períodos de muestreo y, de 
hecho, a convertirse en cero y mantenerse en cero después del número mínimo posible de períodos 
de muestreo. 

Si la respuesta de un sistema de control en lazo cerrado a una entrada escalón muestra el 
tiempo de asentamiento mínimo posible (es decir, cuando la salida alcanza su valor final en un 
tiempo mínimo y se queda ahí), sin error en estado permanente y ninguna componente oscilatoria 
entre instantes de muestreo, entonces este tipo de respuesta se conoce comúnmente como respuesta 
con oscilaciones muertas. La respuesta con oscilaciones muertas será analizada en esta sección. (La 
volveremos a ver en el capitulo 6, donde analizaremos la técnica de ubicación de polo y el diseño de 
los observadores de estado.) 

Los estudios que siguen están limitados a la determinación de algoritmos de control o funcio- 
nes de transferencia pulso de controladores digitales para sistemas de una entrada-una salida, dadas 
las características deseadas de respuesta óptima. Para el control óptimo de sistemas de múltiples 
entradas-múltiples salidas, ver el capítulo 8, donde se utiliza el método en el espacio de estados. 


Diseño de controladores digitales para un tiempo de asentamiento mínimo con un error 


cero en estado permanente. Considere el sistema de control digital que se muestra en la figura 4- 
39a). La señal de error e(t), que es la diferencia entre la entrada r(£) y la salida c(£), se muestrea en 
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b) 


Figura 4-39 a) Un sistema de control digital; b) diagrama que muestra el sistema de control equivalente, 


cada intervalo de tiempo 7. La entrada al controlador digital es la señal de error de e(kT). La salida 
del controlador digital es la señal de control u(kT). La señal de control u(kT) es alimentada al retén de 
orden cero, y la salida del retén, u(t), que es una señal en tiempo continuo, es alimentada a la planta. 
(A pesar de que no se muestra el dispositivo de muestreo en la entrada del retén de orden cero, la 
señal u(kT) es primero muestreada y alimentada al retén de orden cero. Tal y como se mencionó 
antes, el retén de orden cero que se muestra en el diagrama es un muestreador y retén.) Se desea 
diseñar un controlador digital G,(z) tal que el sistema de control en lazo cerrado muestre el tiempo 
de asentamiento mínimo posible, con un error en estado permanente cero, en respuesta a una entrada 
escalón, rampa o de aceleración. Se requiere que la salida no presente componentes oscilatorias 
entre muestras, después de haber alcanzado el estado permanente. Si se requiere, el sistema deberá 
satisfacer cualquier otra especificación, como es la correspondiente a la constante de error de velo- 
cidad estática. 

Definamos la transformada de z de la planta, precedida por el retén de orden cero, como G(z), 
es decir 


G(z) = O] 


Entonces, la función de transferencia pulso en lazo abierto se convierte en G,(=)G(2), tal y como se 
muestra en la figura 4-396). A continuación definamos la función de transferencia pulso en lazo 
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cerrado deseado como F(z): 
C(2)_ _ Gp(z)G(2) 
R(2) 1+Gp(2)G(2) 











F(z) (4-41) 


Dado que es necesario que el sistema tenga un tiempo de asentamiento finito con un error en estado 
permanente cero, el sistema deberá mostrar una respuesta impulso finita. Por lo tanto, la función de 
transferencia pulso en lazo cerrado deseado debe ser de la forma siguiente: 


N N-1 
_ ez + a12 7 ++ ay 
F(z) = N 
2 
es decir 
F(2)=4+a2 +>-»-*+ayz* (4-42) 


donde N 2 n, y n es el orden del sistema. (Note que F(z) no debe contener ningún término con 
potencias positivas en z, ya que dichos términos en la expansión en series de F(z) implicarían que la 
salida antecede a la entrada, lo que no es posible para un sistema físicamente realizable.) En nuestro 
método de diseño, resolvemos la función de transferencia pulso en lazo cerrado para la función de 
transferencia pulso del controlador digital G,(z). Esto es, buscamos que la función de transferencia 
pulso G,(z) satisfaga la ecuación (4-41). Si se resuelve la ecuación (4-41) en función de G,(z) 
obtenemos 


F(z) 
G(2)11 — F(2)] 


El sistema diseñado debe ser físicamente realizable. Las condiciones para que esto ocurra 
imponen ciertas limitantes a la función de transferencia pulso en lazo cerrado F(z) y en la función de 
transferencia pulso del controlador digital G,(z). Las condiciones para que sean fisicamente realiza- 
bles pueden enunciarse como sigue: 





Gp(2) = (4-43) 


1. El grado del numerador de G,,(z) debe ser igual o menor que el grado del denominador. (De no 
ser así, el controlador requiere que sean datos de entrada futuros los que produzcan la salida de 
corriente.) 

2. Si la planta G,(s) incluye un atraso de transporte e /s entonces el sistema en lazo cerrado 
diseñado debe involucrar por lo menos la misma magnitud de atraso de transporte. (De no ser 
así, el sistema en lazo cerrado tendría que responder antes de que se le diera una entrada, lo que 
es imposible realizar en un sistema físico.) 

3. Si G(2) se expande a una serie en 7”, el término elevado a la potencia menor de la expansión 
serial de F(z) en z`’ debe ser por lo menos igual de grande que el correspondiente a G(z). Por 
ejemplo, si la expansión de G(z) en una serie en z empieza con el término z`“, entonces el 
primer término de F(z) dado por la ecuación (4-42) deberá ser cero, o a, debe ser igual a 0, esto 
es, la expansión deberá ser de la forma 


F(z) = az + az? +: + ayz ™ 


donde XN 2 n, y n es el orden del sistema. Esto significa que la planta no puede responder en 
forma instantánea cuando es aplicada una señal de control de magnitud finita: la respuesta se 
presenta con un atraso de por lo menos un período de muestreo, si la expansión de la serie de 
G(z) empieza con un término z*', 
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Además de las condiciones de la posibilidad física de realización, tenemos que poner atención 
en aspectos de estabilidad del sistema. De manera específica, debemos evitar la cancelación de un 
polo inestable de la planta mediante un cero del controlador digital. Si se intenta este tipo de cance- 
lación, cualquier error en la cancelación entre polos y ceros generará una divergencia conforme pasa 
el tiempo y el sistema se hará inestable. En forma similar, la función de transferencia pulso del 
controlador digital no deberá incluir polos inestables para cancelar ceros de la planta que ocurran 
fuera del círculo unitario. 

Ahora investiguemos lo que ocurrirá con la función de transferencia pulso en lazo cerrado F(z) 
si G(z) incluye un polo inestable (o críticamente estable), esto es, un polo z = « exterior al círculo 
unitario (o bien sobre él). [Note que la discusión siguiente se aplica de la misma manera, si G(z) 
incluye dos polos o más inestables—o críticamente estables.] Definamos 


Gı(z) 


zZQ 


G(z) = 


donde G,(z) no incluye un término que se cancele con z — «œ. Entonces la función de transferencia 
pulso en lazo cerrado se convierte en 








Gi(2) 
CN A 
RE) T+ GOO y, q 20 (4-44) 
za 


En vista de que requerimos que ningún cero de Gp(z) cancele el polo inestable de G(z) en z = a, 
debemos tener 
1 Za 
G — a+ 
1+ Go(z) (2) z>- a+ Go(z)G.(2) 


z— 








1 = F(z) = 


Esto es, 1 — F(z) debe tener como cero a z = œ. También, note de la ecuación (4-44) si ceros de G(z) 
no cancelan polos de G,(z), los ceros de G(z) se convierten en ceros de F(z). [F(z) puede incluir 
ceros adicionales. ] 

Resumamos lo que hemos dicho en relación con la estabilidad. 


1. Dado que el controlador digital G,(z) no debe cancelar los polos inestables (o críticamente 
estables) de G(z), todos los polos inestables (o críticamente estables) de G(z) deberán incluirse 
en 1 — F(z) como ceros. 

2. Los ceros de G(z) que se presenten dentro del círculo unitario pueden cancelarse con polos de 
G»(z). Sin embargo, los ceros de G(z), que ocurran sobre o fuera del círculo unitario, no deben 
cancelarse con polos de G,(z). Por lo tanto, todos los ceros de G(z) que se presenten sobre o 
por fuera del círculo unitario deberán ser incluidos en F(z} como ceros. 


Ahora seguiremos con el diseño. Dado que e(kT) = r(kT) — c(kT), refiriéndonos a la ecuación 
(4-41) tenemos 


E(2) = R(z) - C(2) = R(z)[1 — F(2)) (4-45) 


Note que para una entrada escalón unitario r(A = 1(£) 
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1 


SA 


Para una entrada rampa unitaria r(1) = £1(0), 


Tz" 
A 
Y para una entrada de aceleración unitaria (£) = +£1(0, 
PE) 
21-23" 
Por lo tanto, en general, las transformadas z en estas entradas polinomiales en el dominio de tiempo 
se pueden escribir como 


R(z) = 


P(2) 
(1 MON ZO yan 
donde P(z) es un polinomio en z~". Note que para una entrada escalón unitario, P(z) = 1 y q = 0; para 
una entrada rampa unitaria, P(z) = Tz' y q = 1; y para una entrada de aceleración unitaria, P(z) = 
Po (+20) yg=2. 
Al sustituir la ecuación (4-46) en la ecuación (4-45) obtenemos 


ro > EEN 


R(z) = (4-46) 





(4-47) 


Para asegurarnos de que el sistema llega al estado permanente en un número finito de períodos de 
muestreo y mantiene un error cero en estado permanente, £(z) deberá ser un polinomio en z~ con un 
número finito de términos. Entonces, refiriéndonos a la ecuación (4-47), escogemos que la función 
1 — F(z) tenga la forma 


1= F(z) = (1 — 20 N(2) (4-48) 
donde N(z) es un polinomio en z* con un número finito de términos. Entonces 
E(2) = P(z)N(z) (4-49) 


que es un polinomio en z' con un número finito de términos. Esto significa que la señal de error se 
convierte en cero en un número finito de períodos de muestreo. 

Del análisis anterior, la función de transferencia pulso del controlador digital puede determi- 
narse como sigue. Si se supone primero que F(z) satisface la posibilidad física de realización y las 
condiciones de estabilidad, y a continuación se sustituye la ecuación (4-48) en la ecuación (4-43). 
obtenemos 


F(2) 
G(z)(1 = z)" N(2) 
La ecuación (4-50) da la función de transferencia pulso del controlador digital que producirá un 
error cero en estado permanente, después de un número finito de períodos de muestreo. 
Para una planta estable G,(s), la condición para que la salida no muestre componentes oscilatorios 
entre muestreos después del tiempo de asentamiento, se puede escribir como sigue: 





Gp(z) = (4-50) 
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c(t 2 nT) = constante, para entradas escalón 
c(t 2 nT) = constante, para entradas rampa 
ë(t 2 nT) = constante, para entradas de aceleración 


La condición aplicable deberá ser satisfecha cuando se diseñe el sistema. Al diseñar el sistema, la 
condición sobre c(t), c(t) o ¿(f) deberá de interpretarse en términos de u(1). Note que la planta está en 
tiempo continuo y la entrada a la planta es u(t), que es una función en tiempo continuo; por lo tanto, 
para no tener componentes oscilatorias en la salida c(£), la señal de control u(t) en estado permanente 
debe ser constante o de un incremento monótono (o decrementándose monótonamente) para los 
casos de entrada escalón, rampa y de aceleración. 


Comentarios 


1. Dado que la función de transferencia pulso en lazo cerrado F(z} es un polinomio en z*, todos 
los polos en lazo cerrado están en el origen o en z = 0. El polo múltiple en lazo cerrado en el 
origen es muy sensible a las variaciones de parámetros del sistema. 

2. Aunque un sistema de control digital diseñado para presentar un tiempo de asentamiento míni- 
mo con un error cero en estado permanente en respuesta a un tipo específico de entrada tenga 
caracteristicas excelentes de respuesta transitoria para la entrada para la cual fue diseñado, 
puede mostrar características de respuestas transitorias inferiores o algunas veces inaceptables 
para otros tipos de entrada. (Esto es siempre cierto tratándose de sistemas de control óptimo. 
Un sistema de control óptimo mostrará las mejores características de respuesta para el tipo de 
entrada para el que fue diseñado, pero no exhibirá características de respuesta óptima con 
otros tipos de entradas.) 

3. En el caso en el que un controlador analógico es discretizado, un incremento en el período de 
muestreo modifica la dinámica del sistema, lo que puede llevar a la inestabilidad del mismo. 
Por otra parte, el comportamiento del sistema de control digital que diseñamos en esta sección 
no depende de la selección del período de muestreo. En vista de que las entradas z(t) conside- 
radas aquí son entradas en el dominio del tiempo (como entradas escalón, entradas rampa y 
entradas de aceleración), el período de muestreo T puede ser escogido de manera arbitraria. 
Para un período de muestreo menor, el tiempo de respuesta (que es un múltiplo entero del 
período de muestreo T) se hace menor. Sin embargo, para un período de muestreo T muy 
pequeño, la magnitud de la señal de control se convertirá en excesivamente grande, con el 
resultado de que en el sistema aparecerán fenómenos de saturación, y el método de diseño presen- 
tado en esta sección ya no será aplicable. Por lo tanto, el período de muestreo 7 no debe ser 
demasiado pequeño. Por otra parte, si el período de muestreo T se escoge demasiado grande, el 
sistema puede comportarse de manera no satisfactoria, o incluso puede hacerse inestable cuando 
esté sujeto a entradas variables en el tiempo (como son entradas en el dominio de la frecuencia). 
De ahí que un término medio sea necesario. Una regla práctica sería escoger el período de muestreo 
T más pequeño para que no ocurra ningún fenómeno de saturación en la señal de control. 


` Ejemplo 4-13 
Considere el sistema de control digital mostrado en la figura 4-39a), donde la función de transferencia de 
la planta G,(s) está dada por 


1 
G(s) = Gan 
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Diseñe un controlador digital Gy(z), tal que el sistema en lazo cerrado muestre respuesta con oscilacior 
muertas a una entrada escalón unitario. (En una respuesta con oscilaciones muertas el sistema no mos 
rá componentes oscilatorias entre muestras en la salida, una vez alcanzado el tiempo de asentamiento. ! E 
período de muestreo T se supone de 1 seg. Entonces, utilizando el controlador digital G,(z) diseñado 
esta forma, investigue la respuesta de ese sistema a una entrada rampa unitaria. 

El primer paso en el diseño es determinar la transformada z de la planta que está antecedida por un 


retenedor de orden cero: 


am 5 | 


s s(s + 1) 


s 1 
Se zla + zl 


=(1-2z™' NE: PAE: EN: PA 
(1-2 "Y 1-21" 1-0.367977* 
0.3679(1 + 0.71812 "2 ' (4-51 
= (1- z™ (1 — 0.3679z~') 





Ahora vuelva a dibujar el diagrama del sistema de la misma manera en que se muestra en la figura 4- 
39b). Defina la función de transferencia pulso en lazo cerrado como F(z), es decir 


CG) _ DCE) _ po) 
RC) 1 + Go(2)G() 
Observe que si G(z) se expande a una serie en z* entonces el primer término será 0.36797*. Por lo tante. 
F(z) deberá empezar con un término en z`". 
Al referirnos a la ecuación (4-42) y observar que el sistema es del segundo orden (n = 2), supone- 
mos que F(z) tiene la forma siguiente: 








F(z)=az + az”? (4-52: 
Dado que la entrada es una función escalón, de la ecuación (4-48) requerimos que 


4 


tat 


1 — F(z) = (1 - z75N(2z) (4-5 

Dado que Gíz) tiene un polo críticamente estable en z = }, el requisito de estabilidad define que 1 — Fiz 

debe tener un cero en z = 1. Sin embargo, la función 1 — F(z) ya tiene un término 1 —z”, lo que satisface 

por lo tanto el requisito. 

En vista de que el sistema no deberá mostrar componentes oscilatorias entre muestras y la entrada 

es una función escalón, necesitamos que c(t > 27) sea constante. Si observamos que u(t), la salida del 

retenedor de orden cero, es una función en tiempo continuo, una constante c(t > 27) requiere que utri 

también sea constante para £ > 27. En términos de la transformada z, U(z) debe ser del tipo siguiente de 
series de 77: 

Ulz)=bo+biz "+b(2*+2*4+2*++ -») 


donde b es una constante. Dado que la función de transferencia de la planta G,(s) involucra un integrador. 

b deberá ser cero. (De lo contrario, la salida no podría conservarse constante.) En consecuencia tenemos 
U(z) = bo + biz™' 

De la figura 4-39b), U(z) se puede dar como sigue: 


C(2) _ C(2) R(2) R(2) 
co Roco OCO 








U(z) = 
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1 (1-21 -— 0.3679z7') 
1-27 0.3679(1 + 0.71812*)27* 


1 — 0.36792' 
0.3679(1 + 0.7181 2" 





= F(z) 
= F(z) 


Para que U(=) sea una serie en 27? con sólo dos términos, F(z) debe ser de la siguiente forma: 


F(z) = (1 +0.711812 32 F (4-54) 


donde F, es una constante. Entonces U(z=) se puede escribir como sigue: 


U(z) = 2.7181(1 — 0.36792F; (4-55) 


La ecuación (4-55) da U(=) en términos de F}. Una vez que se determine la constante F,, U(=) se puede 
dar como una serie de 7? con sólo dos términos. 

Ahora determinaremos Mz). F(z) y F. Si se sustituye la ecuación (4-52) en la ecuación (4-53) 
obtenemos 


l=a2'-az2?*=(1-z2UN(2) 
El primer miembro de esta última ecuación deberá ser divisible entre 1 — 27. Si dividimos el primer 


miembro entre 1 — 7, el cociente es 1 + (1 — a,)=7 y el residuo es (1 — a, — a,)z7?. Por lo tanto. N(2) se 
determina como 


NG) =1+(-a)2 7 (4-56) 
y el residuo deberá ser cero. Esto requiere que 
l-a-a=0 (4-57) 


También, de las ecuaciones (4-52) y (4-54) tenemos 
F(2)=a12'+a,2*=(1+0.71812 )2 'F, 
Por lo tanto, 
a +az?=(1+0.71812 E 


La división del primer miembro de esta última ecuación entre 1 + 0,7181>! da el cociente a, y el residuo 
(a, - 0,7181a,)7'. Al igualar el cociente con F, y el residuo con cero, obtenemos 


FE =a 


a — 0.718la, = 0 : (4-58) 
Si se resuelven las ecuaciones (4-57) y (4-58) en función de a, y a, da 
a, = 0.5820, a, = 0.4180 


Entonces, F(z) se determina en la forma 


F(z) = 0.5820z* + 0.41802? (4-59) 
y 
F = 0.5820 
La ecuación (4-56) da 
N(z) = 1 + 0.418027 (4-60) 
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La función de transferencia pulso del controlador digital Gp(z) es determinada a continuación a partir de 
la ecuación (4-50) como sigue. Refiriéndonos a las ecuaciones (4-51), (4-54) y (4-60), 


F(2) 


G zasi 
o0) = GG -z NG) 
Ni (1 + 0.71812"')z '(0.5820) 
2 =1y,-1 
Sn + 0.7181z ES (1-21 + 0.41802 7) 
(1 -z 504 -—0.36792 *) 
_ 1,5820 — 0.5820z”' 
1 + 0,4180z"' 
Con el controlador digital así diseñado, la función de transferencia pulso en lazo cerrado se con- 
vierte en: 
C(z) -1 -2 
— = =0. + 0.4180 
RG) F(z} = 0.5820z 80z 


0.5820(z + 0.7181) 
E E 
La salida del sistema en respuesta a una entrada escalón unitario r(t) = 1 se puede obtener como sigue: 
C(z) = F(z}R(z) 
1 


= (0.58207' + 0.41802 °} ma 
= 0.582027! + z% +z% +zí+. 
Por lo tanto, 
c(0)=0 
c(1) = 0.5820 


c(k) = 1, k=2,3,4,... 
Observe que la sustitución de 0.5820 en lugar de F, en la ecuación (4-55) da como resultado 
U(z) = 2.7181(1 — 0.3679z *)(0.5820) 


= 1.5820 — 0.5820z' 


Por lo tanto, la señal de control u(k) se convierte en cero para k > 2, tal y como se requiere. No existe 
componente oscilatoria entre muestras en la salida una vez alcanzado el tiempo de asentamiento. La 
figura 4-40a) muestra las gráficas de c(k) en función de k, de u(k) en función de k y de u(t) en función de 
t en la respuesta escalón unitario. 
A continuación, investiguemos la respuesta de este sistema a una entrada rampa unitaria: 
C(z) = F(2)R(Z) 


-1 
-2 
a ZU y 
= 0.5820? + 1.5820z ?* + 2.5820z"* + 3.58207"? + 


= (0.5820z"' + 0.4180z 


Para la respuesta rampa unitaria, la señal de control U(z) se obtiene como sigue. Refiriéndonos a las 
ecuaciones (4-51) y (4-59) 





C(2) _ FG) R(2) = F(z) Es 
wr Bos. me GE) (1-2 "Y 





U(z) 
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c(k) 








a) b) 
Figura 4-40 Respuesta del sistema diseñado en el ejemplo 4-13. a) Gráfica de c(4) en función de k, u(k) en 
función de k y u(£) en función de / en la respuesta escalón unitario; b) gráficas de c(k) en función de k, u(k) en 
función de k y u(r) en función de / en la respuesta rampa unitaria. 


A 


(1.5820 — 0.582027) = 


1.5820 +2 *+2z*+2*+>-».. 


La señal u(k) se hace constante (b = 1) para k 2 2. Por lo tanto, la salida del sistema no mostrará compo- 
nentes oscilatorias entre muestras. La figura 4-40b) muestra las gráficas de c(k) en función de k, u(k) en 
función de k y u(£) en función de f en la respuesta rampa unitaria. 

Observe que la constante de error de velocidad estática K, para el presente sistema es 


K, = lim Es AO) 


| a FG) 
= lim la -z | 


. 0.5820z' + 0.4180z ? 
= him- 


= 0.7 
¿+1 1 + 0.41802"' ei 
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Por lo tanto, el error en estado permanente de la respuesta rampa unitaria es 
1 
ess = +7 = 1.4180 
K, 


mismo que aparece en la figura 4-40b). 


En el presente problema de diseño, requerimos que en respuesta a una entrada escalón el 


sistema tenga un tiempo de asentamiento minimo, sin error de estado permanente y sin componentes 
oscilatorias en la salida, una vez alcanzado el tiempo de asentamiento. Si en este problema existen 
una o más limitantes adicionales (por ejemplo, si se especifica arbitrariamente el valor de la constan- 
te de error de velocidad estática K,), entonces deberá incrementarse el número de períodos de muestreo 
antes de alcanzar el estado permanente. Por ejemplo, el sistema de segundo orden pudiera necesitar 
tres o más períodos de muestreo antes de alcanzar el estado permanente, dependiendo de las limitantes 
adicionales impuestas. Vea el ejemplo 4-14 a continuación 


Ejemplo 4-14 


Considere un problema de diseño similar al del ejemplo 4-13 excepto que se especifica la constante de 
error de velocidad estática K,. (En razón de esta limitante adicional, el tiempo de asentamiento será 2 seg 
más largo) El diagrama de bloque del sistema de control digital aparece en la figura 4-39a). La función de 
transferencia de la planta G,(s) bajo consideración es 


ae 
sís + 1) 
Las especificaciones de diseño son 1) que el sistema en lazo cerrado muestre un tiempo de asentamiento 
finito con un error cero en estado permanente en la respuesta escalón unitario, 2) que la salida no presente 
componentes oscilatorias entre muestras, una vez alcanzado el tiempo de asentamiento, 3) que la cons- 
tante de error de velocidad estática K, sea de 4 seg” y 4) que el tiempo de asentamiento sea el mínimo 
posible para satisfacer todas estas especificaciones. El período de muestreo se supone de 1 seg. Diseñe ur. 
controlador digital G,(z) que satisfaga las especificaciones dadas. Una vez diseñado el controlador, in- 
vestigue la respuesta del sistema a una entrada rampa unitaria. 

La transformada z de la planta precedida por un retén de orden cero se obtiene en el ejemplo 4-13 


en la forma: 
„|1 -e7 1 
Glz) -z| s  sí(s+ 5 


_ 0.3679(1 + 0.7181z~')z™' 
(1-24 — 0.3679z~’) 

Defina la función de transferencia pulso en lazo cerrado como F(z): 
C(z) _ _ Go(2)G(2) 

R(z) 1+ Go(2)G(2) 


En vista de que el primer término de la expansión de G(z) es 0.36797!, F(z) debe empezar con un término 
enz: 


G;(s) = 


= F(z) 


F(z) = az + az? + e + anz ™ 


donde N 2 n y n es el orden del sistema (en este caso n = 2). En razón de la limitante adicional, podremos 
suponer que N > 2. Probaremos con N = 3. Por lo tanto, suponemos 


F(z) = az + az”? + az™ (4-61 
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(Si no se obtiene un resultado satisfactorio, debemos suponer que N > 3.) Si se observa que la entrada es 
una función escalón, de la ecuación (4-48) requerimos que 





1 = F(z) = (1-2 N(2) (4-62) 
Observe que la presencia de un polo críticamente estable en z = 1 en la función de transferencia pulso de 
la planta G(z) requiere que | — F(z) tenga un cero en z = 1. Sin embargo, la función 1 — F(z) ya tiene un 
término 1 — z`', por lo tanto satisface el requisito de estabilidad. 
El requisito de que la constante de error de velocidad estática sea de 4 seg”* se puede escribir en la 
forma: 
az 
K, = lim T Gp(z)G(z) 
z=>l 
F(2) 
= li 1 — zna 
Im [ e O 
FA 
N() 


donde utilizamos la ecuación (4-50) con q = 0. Note que de la ecuación (4-62) tenemos que F(1)= 1. 
De ahi, K, se puede escribir como sigue: 
1 
K, = —= 
N() 
Dado que la salida del sistema no debe mostrar componentes oscilatorias entre muestras una vez 
alcanzado el tiempo de asentamiento, requerimos que U(=) sea de la siguiente forma: 


4 (4-63) 


U(z) = bo + biz’ + baz? + b(z da +2 >) 


Debido a que la función de transferencia de planta G,(s) incluye un integrador, b deberá ser cero. Por 
lo tanto, tenemos 


U(z) = bo + biz™ + baz” 
También, de la figura 4-39b), U(z) puede estar dado por 


Ce) - CG) RG) _ 
G(z) R(2)G(2) 


1 — 0.36792 ' 
0.3679(1 + 0.71812"')z' 


Para que U(=) sea serie en =' con tres términos, F(z) debe tener la forma siguiente: 


F(2) = (1 + 0.71812)2"* F(z) (4-64) 


R) 


U(z) = GO) 





F(2) 





= F(z} 


donde F,(=) es un polinomio de primer grado en 7'. Por lo tanto, U(z) puede ser escrito como sigue: 
U(z) = 2.7181(1 — 0.36797 “)F (2) (4-65) 


De las ecuaciones (4-61) y (4-62) tenemos 
1-F(2)=1-a2'-a 2 *-az?*=(1-2 'N(2) 





Si dividimos 1 -— az! — az? — ay? entre 1-7”, el cociente esi+(1—a,)7*+(1-a,-a,)77? y el residuo 
es (1 — a, - a,- az)z7. Por lo tanto, M(z) se determina como 


N(2)=1+(1-a)z* + (1 —ea, - aj)z ? (4-66) 
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y el residuo debe ser cero, de tal forma que 


1-a -a — a =Q (4-67) 

Observe que de la ecuación (4-63) requerimos que A(1) = +. Por lo tanto, al sustituir 7? = 1 en la 
ecuación (4-66) obtenemos 

2a, + a, = 2.75 (4-68) 


También la ecuación (4-64) se puede volver a escribir de la forma 
F(z) =a12*+a22?+a32?=(1+0.71812)z'H(z) 
Por lo tanto, 
a+az'+az?=(1+0.71812 MA(z) 


La división del primer miembro de esta última ecuación entre 1 + 0.7181z"' da el cociente [a, — (a, — 
0.7181a,)z7*] y el residuo [a —0.7181(a,—0.7181a,)]77. Igualando el cociente con F,(z) y el residuo con 
cero, obtenemos 


F(z} = a, + (a, — 0.7181a1)2' 


az — 0.7181(a, — 0.7181a,) = 0 (4-69) 
Si se resuelven las ecuaciones (4-67), (4-68) y (4-69) en función de a,, a, y az obtenemos 
a, = 1.26184, a = 0.22633, a, = —0.48816 


Por lo tanto, F(z) se determina como 


F(z) = 1.26184z"* + 0.226332"? — 0.48816z* 


F(z) = 1.26184 — 0.67979z* 
La ecuación (4-66) da 
N(z) = 1 — 0.26184z"* — 0.488172”? 


La función de transferencia pulso del controlador digital Gp(z) se determina a continuación a partir de la 
ecuación (4-50) como sigue: 
F(z) 
GE- z NG) 
2 (1 + 0.7181z"*)z '(1.26184 — 0.67980z~') 
=l -1 

9.3679(1 + 0-71812— )2 (1 — ¿2x1 — 0.2618427* — 0.488172?) 

(1 - 25d -— 0.3679z*) 
(1 — 0.53872 (1 — 0.36792”') 
(1 — 0.8418z*)(1 + 0.57992””) 


Con el controlador digital así diseñado, la salida del sistema en respuesta a una entrada escalón | 
unitario r(t) = 1 se obtiene como sigue: 


C(2) = F(z)}R(z}) 


Gp(z) E 


= 3.4298 


1 
l= 
= 1.2618z7' + 1.48822? +z° + z% +... 


= (1.26184z* + 0.22633z~? — 0.48816z7>) 
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Por lo tanto, 


c(0) =0 
c(1) = 1.2618 
c(2) = 1.4882 


c(k)=1, k=3,4,5,... 


La secuencia de la respuesta escalón unitario tiene un sobrepaso máximo de aproximadamente 50%. El 
tiempo de asentamiento es de 3 seg. 
Observe que de la ecuación (4-65) tenemos 


U(z) = 2.7181(1 — 0.3679z~')(1.26184 — 0.679792”*) 
= 3.4298 — 3.1096z*' + 0.6798z ? 
Por lo tanto, la señal de control u(k) se convierte en cero para k> 3. Por lo tanto, en la respuesta no existen 
componentes oscilatorias entre muestras. La figura 4-41 muestra las gráficas de c(k) en función de k, u(k) 


en función de k y u(t) en función de z en la respuesta escalón unitario. Note que la suposición de que N = 
3, es decir, la suposición de F(z) dada por la ecuación (4-61), es satisfactoria. 


cik) 





ult) 






tl > ta 
se Figura 4-4F- Gráficas de c(k) en función de k, u(k) en función de k y 


u(t) en función de £ en la respuesta escalón unitario del sistema 
diseñado en el ejemplo 4-14. 
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A continuación investiguemos la respuesta de este sistema a una entrada rampa unitaria: 
C(z) = F(2)R(2) 

ET 

-2'7 


1.261877? + 2.750077? + 3.75002 * + --: 


Il 


(1.26184z"* + 0.22633z * — 0.488162*) 


En la respuesta rampa unitaria, la señal de control U(z) se obtiene como sigue: 
C F F a 
Ue (z) _ FG) (z) _1 Ren 
GG) G(z) Gl)1-z*1-2z 








R(z) = 











ql 


= (3.4298 — 3.10962 * + 0.67982 *) === z z` 


= 3.4298z~' + 0.32022 "+2 +2 *4+2*+-*. 


La señal u(k) se hace constante (b = 1) para k > 3. Por lo tanto, la salida del sistema no exhibirá compo- 
nentes oscilatorias entre muestras. La figura 4-42 muestra las gráficas de c(k) en función de k, u(k) er. 
función de k y u(t) en función de £ para la respuesta rampa unitaria. Note que el error de estado permanen- 
te en la respuesta rampa unitaria es e,, = 1/K, = 4 tal y como se indica en la figura 4-42. 





1 2 3 4 5 tisec)  Figura4-41 Gráficas de c(k) en función de k, u(k) en función de k y 
u(t) en función de 1 en la respuesta rampa unitaria, del sistema 


iseñado en el ejemplo 4-14. 
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Al comparar los sistemas de control digital diseñados en los ejemplos 4-13 y 4-14, notamos 
que este último mejora las caracteristicas de respuesta rampa, a expensas del tiempo de asentamiento. 
(Este último sistema requiere de un período de muestreo adicional, para llegar al estado permanen- 
te.) Observe también que el primero tiene una mejor característica de respuesta escalón, es decir, un 
tiempo de asentamiento más corto, sin sobrepaso. Según los objetivos del sistema, pudiéramos esco- 
ger uno sobre el otro. Si se requieren buenas caracteristicas de la respuesta rampa, entonces el siste- 
ma deberá diseñarse utilizando la entrada rampa como o:entrada de referencia, en lugar de la entrada 
escalón. (Vea el problema A-4-14.) 


PROBLEMAS DE EJEMPLO Y SOLUCIONES 


Problema A-4-1 
Muestre que en forma geométrica los patrones de los polos cerca de z = 1 en el plano z son similares a los 
patrones de los polos en el plano s cerca del origen. 


Solución Observe que 


Cerca del origen del plano s. 
z=e"=1+Ts +T +- 
es decir 
z-1= Ts 


Por lo tanto, los patrones geométricos de los polos cerca de z= | en el plano z son similares a los patrones 
de los polos en el plano s cerca del origen. 


Problema A-4-2 
Considere el sistema descrito por 


y(k) — 0.6y(k — 1) — 0.81y(k — 2) + 0.67y(k — 3) — 0.12y(k — 4) = x(k) 


donde x(k) es la entrada y v(k) es la salida del sistema. Determine la estabilidad del sistema. 


Solución La función de transferencia pulso para el sistema es 


Y(2) _ 1 
X(z) 10.627? — 0.812? + 0.672 * — 0.122 * 
z? 

"20.62 — 0.812? + 0.672 — 0.12 





Defina 
P(z) = z* — 0.6z° — 0.812? + 0.672 — 0.12 


=q2* + az? + a,2? + a32 + 4s, a> 0 
Entonces, tenemos 
a = 1 
a = —0.6 
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da) = 0.81 
43 = 0.67 
a, = -0.12 


Las condiciones de estabilidad de Jury son 
1. la,] < a. Esta condición claramente está satisfecha. 
P(1) > 0. Dado que 
P() = 1 — 0.6 — 0.81 + 0.67 - 0.12 = 0.14 > 0 


entonces la condición está satisfecha. 
3. P(-1)>0. Dado que 


P(-1) = 1 + 0.6 — 0.81 — 0.67 — 0.12 = 0 


la condición no se satisface. P(-1) = 0 implica que existe una raíz en z =—1. 
4. |b3| > |bo]. Dado que 


la do 




















B Aa 1 << 
b= do a4 -| 1 al" 0:9856 
A4 03 < —0.12 0.67 e 
bo = ua -| 1 -0.6 |7 0.5980 
la condición está satisfecha. 
5. |c,| > [co]. En vista de que 
_|bs bo ajom -0.5980 | _ 
c= lb, bl” |-0.5980 -0.9856 | 7 0:6138 
_ |b b zp tors 0.5196] _ _ 
e = lb, b,l 7 | -0.5980 0.9072 | 7 =0-5834 








la condición está satisfecha. 


Del análisis anterior, concluimos que la ecuación característica P(z) = 0 incluye una raíz en z = —1 y las 
otras tres raíces están en el interior del circulo unitario con centro en el origen del plano z. El sistema es 
críticamente estable. 


- Problema A-4-3 
Considere la siguiente ecuación característica: 


P(z) = 7 — 1.32? — 0.087 + 0.24 = 0 (4-70) 


Determine si alguna de las raíces de la ecuación característica se presenta o no por fuera del círculo 
unitario del plano z. Utilice la transformación bilineal y el criterio de estabilidad Routh. 


Solución —Sustituyamos (w + 1)/(w— 1) en lugar de z en la ecuación característica dada, lo que resulta en 


3 2 
(1 Es y z 13 (2) - 0.08” +0.24 =0 











w-1 w-1 w-1 
Al simplificar las fracciones multiplicando ambos términos de esta última ecuación por (w — 1}, obtene- 
mos 


—0.14w° + 1.06w? + 5.10w + 1.98 = 0 è 
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Al dividir ambos miembros de esta última ecuación entre 0.14, obtenemos 


w° — 7.571w? — 36.43w — 14.14 = 0 (4-71) 
El arreglo de Routh para la ecuación (4-71) se convierte en: 
one sign > w 1 36.43 
change >w?  -7.571  -14.14 
w! 38.30 0 
wo 14.14 


El criterio de estabilidad de Routh establece que el número de raíces con partes reales positivas es 
igual al número de cambios en signo de los coeficientes de la primera columna del arreglo. Dado que hay 
un cambio de signo en los coeficientes de la primera columna, existe una raíz en el semiplano derecho del 
plano w. Esto significa que la ecuación característica original dada por la ecuación (4-70) tiene una raíz 
fuera del círculo unitario del plano z. El sistema es inestable. (Compare la cantidad de cálculos necesarios 
en el presente método y la correspondiente en la prueba de estabilidad de Jury. Vea en particular el 
ejemplo 4-6.) 


Problema A-4-4 
Considere el sistema definido por 





Y(2) _ 0.787077' 
Ulz)  1=0.81952* + 0.606577 
0.78702 


“2 — 0.8195z + 0.6065 


El período de muestreo T es 0.5 seg. Utilizando MATLAB, trace la respuesta rampa unitaria hasta k = 20. 


Solución La entrada rampa unitaria u puede ser escrita en la forma 
u=kT, k=0,1,2,... 
En el programa MATLAB, esta entrada se puede dar como 


k = 0:N; u = [T*k]; 


donde N es el fin del proceso en consideración. 
En el programa 4-3 de MATLAB se da un programa MATLAB para trazar la respuesta rampa 
unitaria del sistema considerado. La gráfica resultante aparece en la figura 4-43. 


Problema A-4-5 
Demuestre que si la ecuación característica para un sistema en lazo cerrado se escribe en la forma 
KB(2) _ 
A(z) 
donde A(z) y B(z) no contienen k, entonces los puntos de ruptura de salida y de entrada pueden determi- 
narse a partir de las raíces de 


1 + 0 


ak _ _ AB) -A)B(D) _, 


dz BUz) 


donde los apóstrofos indican la diferenciación respecto a z. 


è 
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MATLAB Programa 4-3 








yk) 





% ——- Unit-ramp response 


% ***** Enter the numerator and denominator of the system 


num=[0 0.7870 OJ; 
den={ù{1 -0.8195 0.6065); 


Y ***** Enter k, unitramp input, filter command and plot 
% command ***** 


k = 0:20; 

u = [0.5*k]; 

y = filter(num,den,u); 
plot(k,y,'0',k,y,-',k,0.5*k, =) 


Y ***** Add grid, title, xlabel, and ylabel ***** 
grid 
title('UnitRamp Response’) 


xlabel('k”) 
ylabel('y(k)') 


Respuesta rampa unitaria 





kkk** 














ok- 1 R i Ea 
0 


2 4 6 8 10 12 
k 


Figura 4-43 Respuesta rampa unitaria del sistema considerado en el problema A-4-4. 
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Solución Escribamos la ecuación característica en- la forma 
f(z) = A(z) + KBG)=0 (4-72) 


Suponga que f(z) = 0 tiene varias raíces del orden r. Entonces f(z) puede escribirse en la forma 


f(z) 5 (z 2 22): — Zp) 


Si diferenciamos esta ecuación con respecto a z y definimos z = z,, obtenemos 
df(z) y 
dz bsza k 
Esto significa que varias raíces de f(z) satisfarán la ecuación siguiente: 
df(z) 
HAL 0 
dz 
es decir 
df(z 
qu) = A'(2) + KB'(2) =0 (4-73) 
donde 
dA (2) yn - BE) 
A (2) ES dz > B (z) ag dz 


Al resolver la ecuación (4-73) en función de K, obtenemos 


A'(z) 

B'(2) 

Este valor particular de K dará como resultado varias raíces de la ecuación característica. Si sustituimos 
este valor de K en la ecuación (4-72), obtenemos 


fe) = AG) - FB) =0 


K=- 





es decir 
B'(2)A(2) - A'(z)B(2) = 0 (4-74) 


Si esta última ecuación se resuelve en función de z, podrán obtenerse los puntos donde se presentan 
varias raíces. Por otra parte, en la ecuación (4-72) tenemos 

A(z) 

B(z) 





K= 


dK _ _A'(z)B(2) - A(z)B'(2) 
dz B?(z) 





Si dK/dz se define igual a cero, obtenemos la misma ecuación que la (4-74). Por lo tanto, los puntos de 
ruptura de salida y de entrada pueden simplemente determinarse a partir de las raices de 


dK _ 
dz a 


Deberá observarse que no todas las soluciones de la ecuación (4-74) o de dK/dz = 0 corresponden a 
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puntos reales de ruptura de salida o de entrada. Un punto como éste para el cual dK/dz =0 es un punto real 
de ruptura de salida o de entrada si y sólo si K en este punto tiene un valor real y positivo. 


Problema A-4-6 
Discuta el procedimiento para diseñar compensadores de adelanto para sistemas de control digital me- 
diante el método del lugar geométrico de las raíces. 


Solución Consideraremos el sistema que se muestra en la figura 4-44 para analizar el procedimiento de 
diseño de los compensadores de adelanto. La compensación mediante adelanto es útil cuando el sistema 
es inestable para todos los valores de ganancia o estable, pero tiene características de respuesta transitoria 
no deseables. Para diseñar compensadores de adelanto, podemos utilizar el procedimiento siguiente: 





Figura 4-44 Sistema de control digital. 


1. De las especificaciones de desempeño, determine la posición deseada para los polos dominantes 
en lazo cerrado. 

2. Mediante el dibujo de la gráfica del lugar geométrico de las raíces, asegúrese si que con el solo 
ajuste de ganancia se puede o no proporcionar los polos deseados en lazo cerrado. Si no se puede. 
calcule la deficiencia angular ġ. Este ángulo adicional deberá ser proporcionado por el compensador 
de adelanto, si el nuevo lugar geométrico de las raíces ha de pasar a través de las localizaciones 
deseadas para los polos dominantes en lazo cerrado. 

3. Suponga que el compensador de adelanto G,(z) es 

Ge) = Koa tZ, dal 

4. Sino se especifican constantes del error estático, determine la localización del polo y del cero del 
compensador de adelanto de tal forma que el compensador de adelanto contribuya con el ángulo 
necesario q. Si no se imponen otros requisitos en el sistema, trate de hacer el valor de a tan grande 
como sea posible. Un valor mayor de æ da generalmente como resultado un valor más grande de 
K „ lo que es deseable. (Si se especifica una constante de error estático particular, por lo regular es 
más sencillo utilizar el método de la respuesta en frecuencia.) 

5. Determine la ganancia en lazo abierto del sistema compensado a partir de la condición de magni- 
tud. 


Una vez diseñado el compensador, verifique si todas las especificaciones de desempeño han sido 
cumplidas o no. Si el sistema compensado no cumple con las especificaciones de desempeño, entonces 
repita el procedimiento de diseño, ajustando el polo y el cero del compensador hasta que todas las espe- 
cificaciones se hayan cumplido. Si se requiere de una constante de error estático grande, ponga en casca- 
da una red de atraso o altere el compensador de adelanto a un compensador de atraso-adelanto. 


~ Problema A-4-7 


Dibuje los diagramas del lugar geométrico de las raíces en el plano z para el sistema que se muestra en la 
figura 4-45 en el caso de los tres siguientes períodos de muestreo: T= 1 seg, T= 2 seg y T = 4 seg. 
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E 
sis +1) 





Figura 4-45 Sistema de control digital. 


Solución Primero obtenemos la transformada z de G(s). Refiriéndonos al ejemplo 3-5, resulta 


l-e" K 
G -2| s  s(s+ 5] 


-1 p K 
= (1 EL zla F 1) 
KT- 1te "j +(e- Te") (4-75) 


(A-z -e7z™') 
A continuación construimos los diagramas del lugar geométrico de las raíces para los tres casos en 
consideración. 


1. Periodo de muestreo T = 1: para T = 1, la ecuación (4-75) se convierte en 
K[((1-1+e bz *+(1-e* -e*)z2? 
d-z50=-e 2 >) 
_ 0.3679K(z + 0.7181) 
{z — 1) — 0.3679) 
Observe que G(z) tiene un cero en z = -0.7181 y polos en z= 1 y en z = 0.3679. El punto de ruptura 
de salida está en z = 0.6479, y el de ruptura de entrada en z = —2.0841. El diagrama del lugar 
geométrico de las raices para este caso se muestra en la figura 4-46a). El valor de ganancia K en 


cualquier punto de los lugares geométricos de las raíces puede determinarse a partir de la condi- 
ción de magnitud 


G(2) = 


K= (z — 1X(z — 0.3679) 
1 0.3679(z + 0.7181) 


Si seleccionamos un punto z en los lugares geométricos de las raíces, el valor de K en dicho punto 
se puede calcular si se sustituye el valor de z en esta última ecuación. (Esto significa que con este 
valor de K este punto en particular se convierte en un polo en lazo cerrado.) La ganancia critica se 
encuentra como K = 2.3925. 

2. Período de muestreo T = 2: para el periodo de muestreo T = 2, tenemos de la ecuación (4-75) 


1.1353K(z + 0.5232) 
(z — MD — 0.1353) 
La función de transferencia pulso G(z) en este caso tiene un cero en z = 0,5232 y polos en z= 1 
y en z = 0.1353. El punto de ruptura de salida está en z = 0.4783 y el de entrada en z = 0.5247. El 


diagrama del lugar geométrico de las raíces para este caso aparece en la figura 4-46b). La ganancia 


crítica K para estabilidad es K = 1.4557, i 
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Plano z 


K = 2,3925 


Im 
K = 1.4557 


Círculo unitario 





i Plano z 
Circulo unitario 


Re 





Figura 4-46 Diagramas del lugar geométrico de las raíces para el sistema mostrado en la figura 
4-45 cuando a) T= 1 seg, b) T=2 seg y c) T= 4 seg. 


3. Período de muestreo T = 4: para el caso en que T= 4, la ecuación (4-46) da 


3.0183K(z + 0.3010) 


SS EE 0 


El punto de ruptura de salida está en z = 0,3435 y el de entrada está en z = 0.9455, El diagrama del 
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lugar geométrico de las raíces se muestra en la figura 4-46c). La ganancia crítica para la estabili- 
dad es K=0.9653. 

De los tres casos considerados, note que mientras más pequeño es el período de muestreo, 
más grande será la ganancia crítica K para la estabilidad. 


Problema A-4-8 
Considere el sistema de control digital que se muestra en la figura 4-47, donde la planta es del 
primer orden y tiene un tiempo muerto de 2 seg. El período de muestreo se supone de 1 seg, es 
decir T= 1. 

Diseñe un controlador digital PI tal que los polos dominantes en lazo cerrado tengan un factor de 
amortiguamiento relativo ¢ de 0.5 y el número de muestras por cada ciclo de la oscilación senoidal amor- 
tiguada sea 10. Obtenga la respuesta del sistema a una entrada escalón unitario. También, obtenga la 
constante de error de velocidad estática K, y encuentre el error en estado permanente en respuesta a la 
entrada rampa unitaria. 








Figura 4-47 Sistema de control digital. 


Solución La función de transferencia pulso de la planta por un retén de orden cero es 


A 


S s+1 
Dar pier l 
a a + zl 
EAN (1-e bz" 
o = 1 O A EA 
E (1 -z1 -— e`'z™ 
0.63212 7? 0.6321 


= 10.36792"  2(z — 0.3679) 


El controlador digital PI tiene la siguiente función de transferencia pulso: 








1 
Gp(2) = Kp + Kit 
K, 
= (K, +K hR 
7 ( P i) z-1 
. 
La función de transferencia pulso en lazo abierto se convierte en 
(K, + Ko Kp ) 
MEA 
keci í K, + K; 0.6321 
aG EAS z-1 z?(z — 0.3679) 
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Plano z 





Figura 4-48 Localizaciones del polo y del cero en el plano z del sistema 
considerado en el problema A-4-8. 


Localizamos los polos en lazo abierto en el plano z tal y como se muestra en la figura 4-48. En este cas» 
está implicado un cero en lazo abierto, en este momento su localización es desconocida. 

Dado que se requiere tener 10 muestras por ciclo de la oscilación senoidal amortiguada, el pos 
dominante en lazo cerrado en la parte superior del plano z debe presentarse sobre una línea desde dl 
origen con un ángulo de 3609/10 = 36°. De las ecuaciones (4-1) y (4-2) vueltas a escribir en la forma 


i= col -2 0) 
V1- E 

= dp 
PES 2 


5 


la localización deseada del polo en lazo cerrado puede determinarse como sigue: al notar que Ê =36 
tenemos 


es decir w/w, = 0.1. Dado que ¢ está definido como 0.5, tenemos 


2rx0.5 1 


reo 


El polo en lazo cerrado está localizado en el punto P en la figura 4-48, donde (en dicho punto P) 


= e70% = 0,6958 
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z = 0.6958 (36 
= 0.5629 + ¡0.4090 
(Note que este punto es la intersección del lugar geométrico de ¿=0.5 y la línea desde el origen que tiene 
un ángulo de 36.) 
Si el punto P debe ser una localización de polo en lazo cerrado en la parte superior del plano z, 
entonces la deficiencia angular en el punto P es 


—36° — 36” — 136.90” — 64.62? + 180° = —93.52° 


El cero del controlador debe contribuir con +93.52. Esto significa que el cero del controlador digital 
deberá colocarse en z = 0.5881. Por lo tanto, 





K, 
K, +K, = 0.5881 (4-76) 


De ahí, el controlador PI queda determinado como sigue: 


z — 0.5881 


Gp(z)= K a] 


donde K = K, + K,. La constante de ganancia K se determina a partir de la condición de magnitud: 


K z — 0.5881 0.6321 =1 
z-1 zz — 0.3679) |2=0.5629+j0.4090 y 


es decir 
K = 0.5070 


Por lo tanto, 


K, + K, = 0.5070 (4-77) 
De las ecuaciones (4-76) y (4-77) encontramos que 


K, = 0.2982 y K; = 0.2088 


Y, por lo tanto, el controlador PI que acabamos de diseñar puede estar dado por 


a -1 
Gp(z) = 0.5070 oe 


Por último, la función de transferencia pulso en lazo abierto se convierte en 


1 ~ 0.58812 0.6321z”* 
1=z™  1-0.36792' 
z 0.3205(1 — 0.588127 *)z 7? 
(1-25 — 0.3679z~') 
La función de transferencia pulso en lazo cerrado se convierte en 


C(z) _ 0.32052? — 0.1885z~* 
R(2) 1- 1.36792"' + 0.36792"? + 0.32052"? — 0.1885z* 
La respuesta c(k7) a la entrada escalón unitario se puede obtener fácilmente mediante el uso de 
MATLAB. Un programa MATLAB para la graficación de la respuesta escalón unitario aparece en el 
programa 4-4 de MATLAB. La gráfica resultante se muestra en la figura 4-49. 


Go(z)G(z) = oson 
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MATLAB Programa 4-4 








% 





Respuesta escalón unitario -—— 


num=[0 O O 0.3205 -0.1885); 
den=[1 -1.3679 0.3679 0.3205 -0.1885]); 
r = ones(1,51); 

v=[0 50 0 1.6]; 

axis(v); 

k= 0:50; 

c = filter(num, den, r); 

plot(k,c,'o”) 

grid 

title Respuesta escalón unitario”) 
xlabel('k”) 

ylabel((c(k)) 








Respuestas escalón unitario 





1.6 de : , j 2 E 


o 


0.8} o 


c(k) 


0.4} 


0.2 F 





J 








35 40 45 50 


Figura 4-49 Gráfica de c(4T) en función de ÅT para el sistema diseñado en el 


problema A-4-8. (Período de muestreo T= I seg.) 


Problema A-4-9 


Capítulo 4 


Considere el sistema que se muestra en la figura 4-50, Deseamos diseñar un controlador digital, de 
forma que los polos dominantes del sistema en lazo cerrado tengan un factor de amortiguamiento relativ 
£ de 0.5. También deseamos que el número de muestras por ciclo de la oscilación senoidal amortigu 
sea 8. Suponga que el período de muestreo T es 0.2 seg. 


Utilizando el método del lugar geométrico de las raíces en el plano z, determine la función 
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entrada escalón unitario. También obtenga la constante de error de velocidad estática K,. 
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orden cero 





digital 


Giz} 









Figura 4-50 Sistema de control digital. 


Solución Localizaremos en primer término los polos en lazo cerrado deseados en el plano z. Refirién- 
donos a las ecuaciones (4-1) y (4-2), para un lugar geométrico del factor de amortiguamiento relativo 
constante, tenemos 


Iz] = e 77 = exp | -2 0) (4-78) 


V1- g 9 


[2 = Tos =2r*=9 
Ws 


Dado que requerimos de ocho muestras por ciclo de la oscilación senoidal amortiguada, el polo dominan- 
te en lazo cerrado en la parte superior del plano z deberá estar localizado sobre una línea con un ángulo 
de 45° y que pase a través del origen tal y como se muestra en la figura 4-51. (Note que el número de 
muestras por ciclo es de 36090. Por lo tanto, ocho muestras por ciclo requiere que 8 = 360%/8 = 45°.) 


Entonces, 
Zz = 45° =? = 2r% 
Ws 
lo que nos da 
Wa 1 
post PA (4-79) 
w 8 
Dado que el período de muestreo T se ha especificado como 0.2 seg, tenemos 
27 2r 
==) = 107 
Por lo tanto, 
1 107 
Wa = ga = T 3.9270 


Al establecer ¢ = 0.5 y sustituir la ecuación (4-79) en la ecuación (4-78), obtenemos 
jz| = e 8% = 0.6354 


Por lo tanto, podemos localizar el polo en lazo cerrado deseado en la parte superior del plano z, de la 
misma manera como se muestra mediante el punto P de la figura 4-51. Observe que en el punto P 


lz| /z = 0.6354 /45° = 0.4493 + j0.4493 


A continuación, obtenemos la función de transferencia de pulso: G(z) de la planta precedida por un 
retén de orden cero: Ae 
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Plano z 


Círculo unitario 





Figura 4-51 Localizaciones de polo y cero para el sistema considerado en el problema A-4-9, 


l-e 


-Ts 1 | 
s sís+1) 


O O 
A E +1) 
0.277 1 1 
= SN AZ AAA 
(1-2 la =P 1-27 EE 1= a 
_ 0.01873(1 + 0.9356z7')z* _ 0.01873(z + 0.9356) 
(1-20 — 0.818727) — (z — 1)(z — 0.8187) 





G(z) -z| 





Podemos ahora localizar los polos en lazo abierto y un cero en el plano z, tal y como se muestra en 
figura 4-51. Dado que el punto P es la localización del polo en lazo cerrado deseado, la defici 
angular en el punto P puede calcularse fácilmente, como sigue: 


—140.79° — 129.43° + 17.97° + 180° = -72.25° 


La función de transferencia pulso del controlador deberá contribuir con 72.25°. 
Escojamos la función de transferencia pulso del controlador como 
z+a 
=K 
Golz) z+Bß 
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y el cero del controlador a fin de cancelar el polo en z = 0.8187, De ahí se puede determinar fácilmente el 
polo del controlador de la condición de ángulo como z = 0.1595. Entonces, tenemos 


1 — 0.81877* 
Gol2) = Ki 015952 


La función de transferencia pulso en lazo abierto del sistema se obtiene, por lo tanto, como sigue: 


1 — 0.8187z ' 0.01873(1 + 0.93562*)z"" 
1 = 0.15952 (1-21 - 0.81872") 


_ „„0.01873(1 + 0.93562 *)z * 
3 (L= 0.15952 (1 — z7*) 


Gp(2)G(z) = K 


La constante de ganancia K puede ser determinada a partir de la condición de magnitud: 


0.01873(z + 0.9356) 
(z — 0.1595)(z — 1) !2=0.4493+j0.4493 


es decir 
K = 13.934 


De ahí, hemos determinado que la función de transferencia pulso del controlador digital es 


1 — 0.8187z * 
Gp(z) = 13959 194152) 


La función de transferencia pulso en lazo abierto es 


_0.2610(1 + 0.9356z*)2"' 
ear (1 - 0.1595 (1 — 273) 


La función de transferencia pulso en lazo cerrado es 


C(2) _ _ Go(2)G() 

R(2) 1+ Go(2)G(2) 
_ 0,2610z"' + 0.24422 ? 
“1 —0.898527* + 0.4037z ? 


Debido a la cancelación de un polo en la planta y en el cero del controlador, el orden del sistema ha 
quedado reducido de tercero a segundo. El sistema tiene sólo un par de polos en lazo cerrado complejos 
conjugados. 

La figura 4-52 muestra la secuencia de la respuesta escalón unitario c(AT) en función de AT. El 
trazo muestra que el sobrepaso máximo es de alrededor de 16.5%. 

Finalmente, se determina la constante de error de velocidad estática K, como sigue: 





K, = imf + A) 


1 — z~! 0,2610(1 + 0.9356z7!)2' 
0.2 (t -0.15952 (1 — 2") 





= lim 


z=>1 


= 3.005 
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Figura 4-52 Gráfica de la secuencia de la respuesta escalón unitario c(k7) en 
función de ÅT para el sistema diseñado en el problema A-4-9 


Problema A-4-10 
Considere el sistema mostrado en la figura 4-53. Suponga que las especificaciones de desempeño estar 
dadas en términos de margen de fase, margen de ganancia, constantes de error de velocidad estática > 
similares. Defina los procedimientos para el diseño de los compensadores de adelanto y de los 
compensadores de atraso mediante el método de respuesta en frecuencia. 


Solución Los procedimientos para el diseño de compensadores de adelanto y de los compensadores dz 
atraso pueden definirse como sigue: 


COMPENSADOR DE ADELANTO 


1. Suponga la forma siguiente para el compensador de adelanto: 


1 + rw 


= Ko =--— <a< 
Gp(w) Ko; Tarw 0<a<1 
La función de transferencia en lazo abierto para el sistema compensado puede escribirse en a 
forma 
1+7w 
Gp(w)G(w) = Ko; FE ay E) 
1 + rw 
—1+arw ciw) 


donde G,(w) = KpG(w). Determine la ganancia de K, que satisfaga el requisito de la constante ae 
error de la velocidad estática dada. 
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Figura 4-53 Sistema de control digital en el plano w. 


2. Utilizando la ganancia K, así determinada, dibuje un diagrama Bode de G,(w), el sistema ajustado 

por ganancia, pero no compensado. Evalúe el margen de fase. 

Determine el ángulo de adelanto de fase necesario ġ a añadirse al sistema. 

4. Añada de 5° ~ 12% a $ para compensar el corrimiento de la frecuencia de cruce de ganancia. 
Defina este ġ añadido como d,, Determine el factor de atenuación a a partir de la ecuación 
siguiente: 


y 


l-a 
l+a 





sen Ọm = 


5. Determine el punto de frecuencia donde la magnitud del sistema no compensado G,(jv) es igual a 
20 log(1/Y a ). Escoja esta frecuencia como la nueva frecuencia de cruce de ganancia. Esta fre- 
cuencia corresponde a v„ = War), y a esta frecuencia se presenta el corrimiento máximo de 
fase Pm- 

6. Determine las frecuencias de esquina del compensador de adelanto como sigue: 


Y |— 


Cero del compensador de adelanto: v= 


1 
Polo del compensador de adelanto: v =— 
Q&T 


7. Verifique el margen de ganancia para asegurarse de que es satisfactorio. De lo contrario, repita el 
proceso de diseño modificando la localización de los polos y de los ceros del compensador hasta 
que se obtenga un resultado satisfactorio. 


La función primordia} del compensador de adelanto es proporcionar atenuación en el rango de 
altas frecuencias para un margen de fase suficiente para el sistema. Las caracteristicas del atraso de fase 
no tienen consecuencias en la compensación mediante atraso. 


COMPENSACIÓN DE ATRASO 


1. Suponga la forma siguiente para el compensador de atraso: 


l+7w 


A Bai 


(8 > 1) 


La función de transferencia en lazo abierto del sistema compensado puede escribirse como 


1 + 
Gn(w)G(w) = KoT gp OM) 


1+7w 


= 2 Gdw) 


1 + Brw i 
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donde G¡(w) = KpG(w). Determine la ganancia Kp que satisfaga el requisito de la constante de 
error de velocidad estática dada. 

2. Si el sistema no compensado G,(w) no satisface las especificaciones referentes a los márgenes de 
fase y de ganancia, entonces encuentre el punto de frecuencia donde el ángulo de fase de la fun- 
ción de transferencia en lazo abierto sea igual a—180° más el margen de fase requerido. El margen 
de fase requerido es el margen de fase especificado más 5° a 12°. (La adición de 5% a 12° compen- 
sa el atraso de fase del compensador de atraso.) Escoja esta frecuencia como la nueva frecuencia 
de cruce de ganancia. 

3. A fin de evitar efectos perjudiciales de atraso de fase en razón del compensador de atraso, el pola 
y el cero del compensador de atraso deberán estar localizados bastante más abajo que la nueva 
frecuencia de cruce de ganancia. Por lo tanto, escoja la frecuencia de esquina v = 1/7 (correspon 
diente al cero del compensador de atraso de fase) una decena por debajo de la nueva frecuencia de 
cruce. 

4. Determine la atenuación necesaria para llevar la curva de magnitud hacia abajo hasta O dB en la 
nueva frecuencia de cruce de ganancia. Notando que esta atenuación es —20 log ß, determine æ 
valor de f. Entonces la otra frecuencia de esquina (que corresponde al polo del compensador de 
atraso) queda determinada a partir de v = 1/(bt). 


Precaución. Una vez diseñado el compensador de atraso en el plano w, Gp(w) deberá transformarse 
el compensador de atraso en el plano z, G,(z). Note que el polo y el cero en el compensador de atraso 
el plano z están muy cerca uno de otro. (Están cerca del punto z = 1.) Ya que los coeficientes del filtro 

deben realizar mediante palabras binarias que utilizan un número limitado de bits, si el número de ta 
empleado resulta insuficiente, las localizaciones de polos y ceros del filtro pueden no realizarse tal 
como se desea, y el compensador resultante podría no comportarse como se espera. Es importante que 
polo y el cero del compensador de atraso se presenten en un número finito de puntos discretos asignab 


Diseñe un controlador digital para el sistema que se muestra en la figura 4-54. Utilice el método 
diagrama Bode en el plano w. Las especificaciones de diseño consisten en que el margen de fase debe 
de 55°, el margen de ganancia por lo menos de 10 dB, y la constante de error de velocidad estática de 
seg”. El período de muestreo se especifica como 0.1 seg, es decir 7=0.1. Una vez diseñado el control 
trace un diagrama del lugar geométrico de las raíces. Localice los polos en lazo cerrado del diagrama: 
encuentre el número de muestras por ciclo de la oscilación senoidal amortiguada. 


Solución La transformada de z de la planta precedida por un retén de orden cero es 


l-er 1 
Ga -z| s  sís+ 5| 


ix 1 
ES zla + zl 


E a 14 0.93552” 
= 000697 "=D =0.81817 3) 
- (0.004683) —+ + 0.9355 


(z — DG - 0.8187) 
Transformemos G(z) en G(w) utilizando la transformación bilineal siguiente: 


_1+(7w/2) _ 1 +0.05w 


zZ =I (Tw) 1- 0.05w 
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1 
sis +2) 





Figura 4-54 Sistema de control digital. 


Al sustituir esta última ecuación en G(z), obtenemos 


0.004683[ 1+0-05% + y 9355 
a 1=0.05w 
1 + 0.05w 1 + 0.05w 
E = 0.05w — E = 0.05w 0.8187) 


_ 0.5(1 + 0.001666w)(1 — 0.05w) 
> w(1 + 0.5016w) 


El diagrama Bode de G(/v) aparece en la figura 4-55. 
Escogeremos ahora la función de transferencia del controlador en la forma 





wW 

1+ rw E 
GoW) = KoT Farw O y 
1+3 


donde a = l/t y b = 1/(a7). La función de transferencia en lazo abierto es 


1 + (w/a) 0.5(1 + 0.001666w)(1 — 0.05w) 
1 + (w/b) w(1 + 0.5016w) 


La constante de error de velocidad estática requerida de K,. Es 5 seg™'. O de ahí, 
K, = lim [wGo(w)G(w)] = 0.5Kp = 5 
w-—>0 


Go(w)G(w) = Ko 


a partir de la cual determinamos que 


Kp = 10 


Utilizando una técnica de diseño convencional, se determina la función de transferencia del 
controlador digital como 


WwW 
1+ T994 
w 
+ >. 
UNOS 


Por lo tanto, la función de transferencia en lazo abierto se convierte en 


Gp (w) = 10 


w 
1 + 7094 0.5(1 + 0.001666w)(1 — 0.05w) 


Go(w)G(w) = 10 w(1 + 0.5016w) 


w 
+3 
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Figura 4-55 Diagrama Bode correspondiente al sistema considerado en el problema A-4-11 







Esta función de transferencia en lazo abierto da el margen de fase de aproximadamente 55° + 
margen de ganancia de alrededor de 12.4 dB. La constante de error de velocidad estática K, es 5 seg” 
Por lo tanto, se satisfacen todos los requisitos y la función de transferencia del controlador diseñ. 
Gp(w) es satisfactoria. 

A continuación, transformamos G,(w) en G,(z). Se deberá utilizar la siguiente transformac 














bilineal 
_2z-1_2z 1 af? 1 
"Tz2+1 01z+1 z+1 
Entonces 
i4 20 z-1 
1.994z +1 
Gp(z) = 10 k 20 7-1 
25z+1 
z — 0.8187 1 — 0.8187z ' 
E 22.00 - oen) g aani - ossa) 


La función de transferencia pulso en lazo abierto ahora se convierte en 


0.1987(z + 0.9355) 
(z — 0.2308)(z — 1) 
La figura 4-56 muestra el diagrama del lugar geométrico de las raices para el sistema. Al usar 


condición de magnitud, encontramos que los polos en lazo cerrado están localizados en z = 0.516 
30.388. En el diagrama del lugar geométrico de las raíces, se superponen los lugares geométricos de 


Gp(2)G(z) = 
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Plano z 


Circulo unitario 





Figura 4-56 Diagrama del lugar geométrico de las raíces para el sistema diseñado en el problema 
AS-11. 


constante para ¢= 0.5 y para £=0.6. Se puede ver del diagrama que el factor de amortiguamiento relativo 
¿ de los polos en lazo cerrado es de aproximadamente 0.55. 

La línea que conecta el polo en lazo cerrado en la parte superior del plano z con el origen tiene un 
ángulo de 37°. Por lo tanto, el número de muestras por ciclo de la oscilación senoidal amortiguada es 
3609/37? = 9.73. 


Problema A-4-12 
Considere el sistema de control digital mostrado en la figura 4-57, donde la función de transferencia de 
la planta es 1/s?. Diseñe un controlador digital en el plano w, tal que el margen de fase sea de 50° y el 
margen de ganancia sea de por lo menos 10 dB. El período de muestreo es 0.1 seg, es decir T = 0.1. 
Después de diseñar el controlador, obtenga la constante de error de velocidad estática K,. También, 
obtenga la respuesta del sistema diseñado ante una entrada escalón unitario. 


Solución Primero obtendremos la transformada z precedida por un retén de orden cero: 


G(2) = qn a =(1- 9213] 


T+ 
T PESE E o T AS 
a ql z ) 2(1 m 2 y 
_0.005(1 + z _ 0.005(z + 1) 
© -zF (z -17 
A continuación, utilizando la transformación bilineal dada por 
_ 1 +(Tw/2) _ 1+ 0.05w 
2 =1=(7wN) 1- 0.05w 
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Figura 4-57 Sistema de control digital. 


transformamos G(z) en G(w): 





1 + 0.005w 
o bl ) 1 — 0.05w 
G(w) = a 2 
( + 0.05w _, w 
1 — 0.05w 
Por lo tanto, 
; 1 — 0.05jv 
G(jv) = — z 
(j ) (juy 


La figura 4-58 muestra el diagrama Bode de G(¡v) que se obtiene de esta manera. Observe que el margen 
de fase es —12°. Será necesario añadir una red de adelanto para conseguir el margen de fase y el margen 
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Figura 4-58 Diagrama Bode para el sistema considerado en el problema A-4-12. 
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Figura 4-57 Sistema de control digital. 


transformamos G(z) en G(w): 


1 + 0.005w 
0.005| 1 — 0.05w ) 1 — 0.05w 
1 + 0.05w _ 1 w 
1 — 0.05w 
Por lo tanto, 
; 1 — 0.05Sjv 
G(jv) = => 
(j ) (¡uy 


La figura 4-58 muestra el diagrama Bode de G(¡v) que se obtiene de esta manera. Observe que el m 
de fase es —12°. Será necesario añadir una red de adelanto para conseguir el margen de fase y el m 
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Figura 4-58 Diagrama Bode para el sistema considerado en el problema A-4-12. 
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de ganancia requeridos. Mediante la aplicación de una técnica convencional de diseño, puede verse que 
la red de adelanto siguiente satisface los requisitos: 


i+w w+1 
Sak AT 02 + 2) 


La adición de esta red de adelanto modifica el diagrama Bode. La frecuencia de cruce de ganancia se 
recorre a y = 4. Note que el adelanto de fase máximo d,, que puede producir esta red de adelanto es 
61.937, ya que 


e 


1- 


1 1 


1+ 


AN 


=sen”' 0,8824 = 61.93" 





Om = Sin” 


al 


A la frecuencia de cruce de ganancia v = 4, el ángulo de fase de GaU rG v) se convierte en —191.31° + 
61.93” = 129.38". Por lo tanto, el margen de fase es 50.62°. El margen de ganancia se determina aproxi- 
madamente en 12 dB. Por lo tanto, se satisfacen las especificaciones de diseño dadas. 

Ahora transformamos la función de transferencia del controlador G,(w) en Gp(z). Mediante la 
transformación bilineal 











et fi) 








Tz+1 012+1 7+1 
obtenemos 
z-1 
20 E 1 

z+1 z — 0.9048 

Go(z) = Cer = arsa 20308) 
+ 
z+1 


Entonces, la función de transferencia pulso en lazo abierto se convierte en 


E z — 0.9048 \0.005(z + 1) 
Gp(z)G(z) = ESE 5 ooms) (2 -17 


_ 0.1867(1 — 0.90482 `)(1 + z™')z™ 
a - 0111124 -2 y 
La constante de error de velocidad estática K, se obtiene como sigue: 


de im r- O) 


[1 — z7! 0.1867(1 — 0.90482 ')(1 + 2727" 
= lim FA OEA ARA A a 00 
0.1 a = 011112 D4 =25) 





z>1 


Por lo tanto, la constante de error de velocidad estática K, es infinita. No existe error en el estado perma- 
nente en la respuesta rampa. 
La función de transferencia pulso en lazo cerrado del sistema es 


C(z) _  0.1867z ' + 0.0178z ? — 0.16897 ? 
R(z) 1- 1.92442? + 1.24007 ? — 0,28002 ? 
La figura 4-59 muestra la respuesta escalón unitario. Note que el cero del controlador digital de z = 


0.9048 está cerca del polo doble en z = 1. Un par polo-cero cerca del punto z = 1 genera una cola larga de 
pequeña amplitud en la respuesta. 
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Figura 4-59 Gráfica de c(X7) en función de AT para el sistema diseñado en el problema A-4-12. 


Problema A-4-13 


Considere el sistema de control digital mostrado en la figura 4-60. La función de transferencia de ia 
planta incluye un atraso de transporte e”*. El tiempo de atraso es 5 seg, es decir L = 5. La salida deseaúz 
c(t) en respuesta a una entrada escalón unitario es como se muestra en la figura 4-61 a). La curva se eleva 
desde cero hasta su valor final en 10 seg (medido desde £ = 5 hasta 1 = 15). Y no existe ni sobrepaso ru 
error en estado permanente. El tiempo de asentamiento es de 15 seg (medido desde ! = 0 hasta 1= 15). Se 
requiere que no existan componentes oscilatorias entre muestras en la salida después de haber alcanzado 
el tiempo de asentamiento. Diseñe un controlador digital G,(z). 


Solución —Seleccionemos el período de muestreo como de $ seg, es decir T= 5. (Podemos, naturalmer- 
te, elegir el período de muestreo como de 2.5 seg, 1 seg u otro valor. En este ejemplo, sin embargo, pare 
simplificar nuestra presentación, hemos definido el período de muestreo en 5 seg.) 





elKk Td Controlador Retén de 
digital orden cero 






Figura 4-60 Sistema de control digital. 


www.FreeLibros.me 





Capítulo 4 Problemas de ejemplo y soluciones 281 


cit) 





hii- eetl -5 


apa 
mn” 















0.5 
0 1 2 3 4 5 6 k 
0 5 10 15 20 25 30 ris ) 
(a) 
uit) 
1.5820 
1.0 
0 5 10 15 20 25 30 rls ) 
(b) 


Figura 4-61 a) Salida deseada c(£) en respuesta a una entrada escalón unitario; 
b) Gráfica de u(t) en función de /. 


La transformada z de la planta, precedida por un retén de orden cero, es 


1- er e75 
G) -z| s 10s + l 


1 
= == =t ary Tla a 
a a + zl 
0.393527? 
~ 1 —0.6065z7* 


Note que no existe ningún polo inestable o criticamente estable en G(z). Por lo tanto, en este caso no hay 
problema de estabilidad. 
Definamos la función de transferencia pulso en lazo cerrado como F(z): 


Ce) GaC) 
Ro TG A Se 


En el caso presente, la salida c(ż) en la respuesta escalón unitario se define tal y como se muestra en la 
figura 4-61a). En vista que A[1 — e7105-9 = (1 — e!) = 1 tenemos que A = 1.5820, A partir de la curva 
de respuesta con oscilaciones muertas que se muestra en la figura 4-61a) obtenemos 


c(0) =0 
c(1) =0 
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c(2) = h(1 — e7%%) = 1.5820 x 0.3935 = 0.6225 
c(k) = 1, k=3,4,5,... 
de lo cual obtenemos 
C(z) = 0.6225 "+2 4+z2 4254 


= 0.62257? + z 7? 1 = 
1-z 


0.622527? + 0.377527? 
l=z* 





Si se observa que 


1 ES 0.6225z27? + 0.37752 7? 
(=z l=z* 





C(2) = F(z)R(2) = F(z) 


obtenemos 
F(z) = 0.622527? + 0.3775z7° = 0.6225(1 + 0.6065z~')z ~? 


Una vez determinada F(z), la función de transferencia pulso del controlador digital puede obtenerse a 


partir de la ecuación (4-80): 
z F(z) 
C2) = GO -FE 


Observe que de la ecuación (4-48) tenemos 
1 — F(2) = (1 — z275)N(2z) 
es decir 
1 — 0.6225z~? — 0.3775z™° = (1 — zUN(z) 
Al dividir (1 —0.62257? — 0.37757°) entre (1 — z`’), se puede determinar N(z) como sigue: 
N(2) =1 +z + 0.37757? 
Y, en consecuencia, 


1 — F(z) = (1-21 +27 +0.377527?) 


y 
0.6225(1 + 0.60652 ~')z ~? 
Go(z) = -5393577 , z ? ; 
I ossz \! — 2 (1 +2? + 0.3775z~°) 


E 1.5820(1 — 0.3678z 7?) 
(1-24 + z~! +0.37752?) 
Esta última ecuación da la función de transferencia pulso del controlador digital. Dado que c(t) debe ser 
la unidad en estado permanente, u(t), una señal en tiempo continuo, deberá ser constante una vez alcan- 
zado el estado permanente. 
Determinemos u(z): 


_ C(z) _ 0.622527? + 0.37752* ( — 0.3678z 7? 
S G(z) a H 27) 03052 MG A 
1 — 0.6065z 


= 1.5820 + 1.5820 + z? +2? +z“ +.. 
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Al tomar la transformada z inversa de U(z), encontramos que u(k) es constante para k2 2. Por lo tanto, no 
existen componentes oscilatorias entre muestras en la salida una vez que se ha alcanzado el tiempo de 
asentamiento. La señal u(t) en función de t aparece graficada en la figura 4-61b). 


Problema A-4-14 
Considere el sistema de control digital que se muestra en la figura 4-62. Diseñe un controlador digital 
Gpíz) tal que el sistema en lazo cerrado exhiba el tiempo de asentamiento mínimo con un error en estado 
permanente cero en una respuesta rampa unitaria. El sistema no podrá tener componentes oscilatorias 
entre muestras en estado permanente. El período de muestreo 7 se supone de 1 seg. Después de diseñar el 
controlador, investigue la respuesta del sistema a una entrada delta de Kronecker y a una entrada escalón 
unitario. 


Solución El primer paso en el diseño será determinar la transformada z de la planta que está antecedida 
por un retén de orden cero: 


er 1 1 
G(z) -|= 3] =(1- 025] 


S 
AR 
2X(1 — e 
Ahora definamos la función de transferencia pulso en lazo cerrado como F(z): 
cz) _ Gp(2)G(z) 


RO 1+ GOG E E) 


Observe que si G(z) se expande a una serie en z* entonces el primer término será 0.5 de z”*. Por lo tanto, 
F(z) debe de empezar con un término en 7”: 
F(2)= 423 + az? +: +aynz? 
donde N > n siendo n el orden del sistema. Dado que el sistema aquí es de segundo orden, n = 2. 
En vista de que la entrada es una rampa unitaria, de la ecuación (4-48) requerimos que 


1 — F(z) = (1-2 YPN(2) (4-81) 


Note que G(z) tiene un polo doble criticamente estable en z = 1. Por lo tanto, desde el punto de vista del 
requisito de estabilidad, 1 — F(z) deberá tener un cero doble en z = 1, Sin embargo, 1 — F(z) ya implica un 
término (1 —- z7*), satisfaciendo por lo tanto el requisito de estabilidad. 

Dado que el sistema no debe mostrar componentes oscilatorias entre muestras en el estado perma- 
nente, requerimos que U(z) sea del tipo siguiente de la serie en 2”: 


Ulz)=bo+bi2 + baz? + o t by MP + b(a N t z 2 A) 





Figura 4-62 Sistema de control digital. 
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Dado que la función de transferencia de la planta G,(s) incluye un doble integrador, b debe ser cero. 
lo contrario, la salida aumentará en forma parabólica, en vez de linealmente.) En consecuencia. te: 


mos 
U(z) == bo + biz A byi NTI 


De la figura 4-62, U(z) puede darse en la forma 











_C()_CG)RG)_ R(2) 
AO A 
K z! 21- z`} 
FOr Farz 

FOr 


Para que U(z) sea una serie en z™' con un número finito de términos, F(z) debe ser divisible entre 1 -7 


F(z) = (1 + 27)K(2) 


Entonces, U(z) se puede escribir como sigue: 


U(z) = 2K(2) 


donde F(z) es un polinomio en z* con un número finito de términos. 
Al comparar las ecuaciones (4-81) y (4-82) y mediante un simple análisis, vemos que F(z) 3 
incluir un término con por lo menos 2”. Por lo tanto, suponemos 


F(z)=a,2'+a.23*+a32 7? 


Esta forma supuesta de F(z) involucra sólo el número mínimo de términos, la respuesta transitorx 
asentará en tres períodos de muestreo. 
Determinaremos ahora las constantes a,, a, y az. De la ecuación (4-81) tenemos 


1-az'-az?*-az*=(1-2 Y N() 
Si dividimos el primer miembro de esta última ecuación entre (1 —z2""Y, el cociente es 1 +(2-a.c” 
residuo es [2(2 — a) — (1 + a,)]7? — [(Q - a,) + as]z?. De ahí, se determina M(z) en la forma 
N2)=1+0Q-a)z" 
y el residuo se iguala a cero: 
(2Q-a)- (1 + a)]z™? — (2 — a, + a3)z™° = 0 


Para satisfacer esta última ecuación, es necesario que 


22-a)-(1+a)=0 
2-a1+a3=0 
De la ecuación (4-82), tenemos 
az +az?t+az?*=(1+z A) 
Si dividimos el primer miembro de esta última ecuación entre 1 + z`', el cociente es ay '+(a,-a E 
residuo es (a, — a, + az)z”. Por lo tanto, 
R(z)= az’ + (a, — aj)z ? 
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- y el residuo se iguala a cero: 
a 4+a3=0 (4-86) 
Al resolver las ecuaciones (4-84), (4-85) y (4-86) en función de a}, a, y az, obtenemos 
a, = 1.25, a = 0.5, az, = —0.75 
Por lo tanto, 


N(z) = 1 + 0.75z~' 


R(z) = 1.2527? — 0.7527? = 1.252 "(1 — 0.627*) 
y F(z) se determina como sigue: 
F(z) = 1.252 * + 0.527? — 0.7527? 
=1.252 (1 +2 (1 - 0.627?) 
El controlador digital G,(z) se determina a continuación de la ecuación (4-50): 
F(2) 
G(DA — 27°} N(2z) 
1.2582" (1 +25 — 0.627”) 
(G +z 
r= Y 
_ 2.5(1 — 0.6z7') 
1 + 0.7527” 


Con el controlador digital así diseñado, la salida del sistema en respuesta a una entrada rampa 
unitaria se obtiene como sigue: 


CG) = F(z)R(z) 


Gp(z) = 


(G — z~}? (1 + 0.7527) 


-1 
= -1 nos y 
= (1.2527 + 0.527? - 0.152) 2 
=1.252 +32 +42 * 452 +- 


Y por lo tanto, 


c(0) =0 
c(1) =0 
c(2) = 1.25 


c(k) = k, k=3,4,5,... 
Observe que de la ecuación (4-83) tenemos 


U(z) = 2K (2) 
= 2(1.252")(1 — 0.62 *) 
N = 2.5z7' — 1.527? 


Por lo tanto, la señal de control U(k) se convierte en cero para k > 3. Consecuentemente, no habrá 
componentes oscilatorias entre muestras en la respuesta en estado permanente. La figura 4-63 muestra 
las gráficas de c(k) en función de k, u(k) en función de k y u(t) en función de ¢ en la respuesta rampa 
unitaria. 
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clk) 












Figura 4-63 Gráficas de c(k) en función de k, u(k) en funci 
t(s} k y u(£) en función de £ en la respuesta rampa unitaria del si 
diseñado en el problema A-4-14. 


A continuación, investiguemos la respuesta de este sistema a una entrada delta de Kroneck 
una entrada escalón unitario. En el caso de una entrada delta de Kronecker 


C(z) = F(OR() = F(z) = 1.252 * + 0.52? — 0.7527? 
Note que U(z) en este caso se convierte en: 
R(z) 2 1.257 (1 + z™')(1 — 0.6z~') 
G(z) G + zz 24-23 *y] 
= 2.5(1 — 0.62 11 -z Y 
= 2.5 — 6.527? + 5.52? — 1.52? 





U(z) = F(z) 


N 


La señal de control u(k) se convierte en cero para k 2 4. Por lo tanto, no habrá componentes osci 
entre muestras después de > 47'=4. 
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En el caso de la entrada escalón unitario, 
C(2) = F(OR(G) = (1.252 * + 0.52? — 0752) 


= 1.2527 + 1.752? + z° +z% +z +. 
El sobrepaso máximo es de 75% en la respuesta escalón unitario. Observe que 
R(2) 1.252 (1 +24 - 0.67?) 
Gz) (+2 52" F 
A 1 = 
-zY ( zos) 
= 1.25(1 - 0.62 241 - 23) 


= 2.5 — 47* + 1.527? 


U(z) = F(2) 





La señal de control u(k) se convierte en cero para k 2 3. En consecuencia, no habrán componentes 
oscilatorias entre muestras después de que se ha alcanzado el tiempo de asentamiento. En la figura 4-64a) 
se muestran las gráficas de c(k) en función de k, u(k) en función de k y u(t) en función de ¢ en respuesta 
a la entrada delta de Kronecker. La figura 4-64b) muestran gráficas similares para la respuesta escalón 
unitario. Note que cuando el sistema se ha diseñado para la entrada rampa la respuesta a una entrada 
escalón ya no es oscilatoria. 





a) b) 
Figura 4-64 a) Gráficas de c(k) en función de k, u(k) en función de k y u(£) en función de f en la respuesta a una 
entrada delta de Kronecker del sistema diseñado en el problema A-4-14: b) Gráficas de c(k) en función de k, u(k) en 
función de k y u(r) en función de ¢ en la respuesta escalón unitario para el mismo sistema. 
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PROBLEMAS 


Problema B-4-1 
Considere las regiones en el plano s que se muestran en las figuras 4-65a) y b). Dibuje las regio 
correspondientes en el plano z. El período de muestreo T se supone de 0.3 seg. (La frecuencia de mue 
es w, = 211/T = 277/0.3 = 20.9 rad/seg.) 

[0 


Plano s 


j? (rad/seg) 


(a) 





jw 






Plano s 


JT (rad/seg) 


(b) 


Figura 4-65 a) Región en el plano s limitada 
líneas de w constantes y líneas de a constantes: $ 
región en el plano s limitadas por líneas de / 

constantes, líneas de w constantes y una línea de 
constante. 


Problema B-4-2 
Considere la siguiente ecuación característica: 


z? + 2.12? + 1.44z + 0.32 =0 


Determine si cualquiera de las raíces de la ecuación característica están o no fuera del círculo unitario 
centro en el rigen del plano z. 


Problema B-4-3 
Determine la estabilidad del siguiente sistema en tiempo discreto: 
Y(z) _ z? 
X(z) 1+0.57' — 1.342? + 0.242? 





Problema B-4-4 5 
Considere el sistema de control en tiempo discreto en lazo cerrado mostrado en la figura 4-13. Dete 
el intervalo de la ganancia K para estabilidad mediante el uso del criterio de estabilidad de Jury. 
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Problema B-4-5 
Resuelva el problema B-4-4 utilizando la transformación bilineal junto con el criterio de estabilidad de 
Routh. 


Problema B-4-6 
Considere el sistema 


Y(z) _ _bot+biz +: + bz” 
X(z) Ca 1+az t + e +a” 


Suponga que la secuencia de entrada {x(k)} es acotada. Esto es, 
bk] < M, = constante, siendo k=0,1,2,... 


Demuestre que, si todos los polos de G(z) están dentro del círculo unitario en el plano z, entonces la salida 
v(k) también es acotada; esto es, 


WOS Mh = constante, siendo k=0,1,2,... 


Problema B-4-7 
Enuncie las condiciones de estabilidad, inestabilidad y estabilidad crítica en términos de la secuencia de 
ponderación g(kT) de un sistema de control en tiempo discreto lineal e invariante con el tiempo. 


Problema B-4-8 
Considere el sistema de control digital que se muestra en la figura 4-66. Trace los lugares geométricos de 
las raíces conforme se varía la ganancia K desde O hasta œ. Determine el valor crítico de la ganancia K 
para estabilidad. El período de muestreo es de 0.1 seg, es decir T=0.1. ¿Qué valor de la ganancia K dará 
un factor de amortiguamiento relativo £ de los polos en lazo cerrado igual a 0,5? Con la ganancia K 
definida para obtener ¢ = 0.5, determine la frecuencia natural amortiguada w, y el número de muestras 
por ciclo de la oscilación senoidal amortiguada. 










Kiz +1) 
{z ~ 1íz - 0.6065) 





Figura 4-66 Sistema de control digital para el problema B-4-8. 


Problema B-4-9 
Refiriéndonos al sistema de control digital mostrado en la figura 4-67, diseñe un controlador digital 
Gp(z) tal que el factor de amortiguamiento relativo £ de los polos dominantes en lazo cerrado sea 0.5 y el 
número de muestras por ciclo de la oscilación senoidal amortiguada sea 8. Suponga que el período de 
muestreo es de 0.1 seg es decir 7 = 0.1. Determine la constante de error de velocidad estática. También. 
determine la respuesta del sistema diseñado a una entrada escalón unitario. 


Problema B-4-10 
Considere el sistema de control mostrado en la figura 4-68. Diseñe un controlador digital adecuado que 
incluya úna acción de contro! integral. Las especificaciones de diseño son que el factor de amortiguamiento 
relativo £ de los polos dominantes en lazo cerrado sea 0.5 y que existan por lo menos 8 muestras por ciclo 
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Figura 4-68 Sistema de control digital para el problema B-4-10. 


de la oscilación senoidal amortiguada. El período de muestreo se supone de 0.2 seg es decir T= 0.2. Una 
vez diseñado el controlador digital, determine la constante de error de velocidad estática K.. 


Problema B-4-11 
Considere el sistema de control digital mostrado en la figura 4-69, donde la planta es de primer orden y 
tiene un tiempo muerto de 5 seg. Seleccionando un periodo de muestreo razonable 7, diseñe un controlador 
digital PI tal que los polos dominantes en lazo cerrado tengan un factor de amortiguamiento relativo £ de 
0.5 y el número de muestras por ciclo de la oscilación senoidal amortiguada sea 10. Después de diseñar 
el controlador, determine la respuesta del sistema a una entrada escalón unitario. 





Figura 4-69 Sistema de control digital para el problema B-4-11. 


Problema B-4-12 
Diseñe un controlador proporcional y derivativo digital para la planta cuya función de transferencia es 1/ 
s? tal y como se muestra en la figura 4-70. Se desea que el factor de amortiguamiento relativo £ de los 
polos dominantes en lazo cerrado sea de 0.5 y la frecuencia natural no amortiguada sea 4 rad/seg. El 
período de muestreo es 0.1 seg, es decir T= 0.1. Después de diseñar el controlador, determine el número 
de muestras por ciclo de la oscilación senoidal amortiguada. 
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rit) 






Controlador 
PD digital 








Figura 4-70 Sistema de control digital para el problema B-4-12. 


Problema B-4-13 
Al hacer referencia al sistema considerado en el problema A-4-9, rediseñe el controlador digital de tal 
forma que la constante de error de velocidad estática K, sea 12 seg”, sin cambiar en forma apreciable las 
posiciones de los polos dominantes en lazo cerrado en el plano z. El período de muestreo se supone de 0.2 
seg o T = 0.2. Una vez rediseñado el controlador, obtenga la respuesta escalón unitario y la respuesta 
rampa unitaria del sistema de control digital, 


Problema B-4-14 
Considere el sistema de control digital mostrado en la figura 4-71. Dibuje un diagrama Bode en el plano 
w. Defina la ganancia K de tal manera que el margen de fase sea igual a 50°. Con la ganancia K£ definida 
de esta forma, determine el margen de ganancia y la constante de error de velocidad estática K,. Se 
supone que el período de muestreo es de 0.1 seg, es decir T= 0.1. 







rit) 





1 
sis + 10) 











Figura 4-71 Sistema de control digital para el problema B-4-14. 


Problema B-4-15 
Utilizando el método del diagrama Bode en el plano w, diseñe un controlador digital para el sistema 
mostrado en la figura 4-72. Las especificaciones de diseño consisten en que el margen de fase sea de 50°. 
el margen de gañancia de por lo menos 10 dB, y la constante de error de velocidad estática X, sea de 20 
seg”. El período de muestreo se supone de 0.1 seg, es decir T = 0.1. Una vez diseñado el controlador. 
calcule el número de muestras por ciclo de la oscilación senoidal amortiguada. 








Figura 4-72 Sistema de control digital para el problema B-4-15. 
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Problema B-4-16 
Considere el sistema de control digital de la figura 4-73. Al usar el método del diagrama de Bode en el 
plano w, diseñe un controlador digital de tal forma que el margen de fase sea de 60°, el margen de 
ganancia de 12 dB o más, y la constante de error de velocidad estática de 5 seg”'. El período de 
muestreo se supone de 0.1 seg, es decir T= 0.1. 


(s + Tor +2) 






Figura 4-73 Sistema de control digital para el problema B-4-16. 


Problema B-4-17 
Considere el sistema mostrado en la figura 4-74. Diseñe un controlador digital utilizando un diagra 
Bode en el plano w de tal forma que el margen de fase sea de 50° y el margen de ganancia de por lo me 
10 dB. Se desea que la constante de error de velocidad estática K, sea de 10 seg”. El periodo de muest: 
está especificado como 0.1 seg, es decir 7 = 0,1. Una vez diseñado el controlador, determine el núme 
de muestras por ciclo de la oscilación senoidal amortiguada. 










K(2s +1) 
sis + 1)(0.25 + 1) 








Figura 4-74 Sistema de control digital para el problema B-4-17. 


Problema B-4-18 
Considere el sistema de control digital mostrado en la figura 4-75. Diseñe un controlador digital G,(=): 
que la salida del sistema tenga una respuesta con oscilaciones muertas a una entrada escalón unit 
(esto es, el tiempo de asentamiento será el mínimo posible y el error en estado permanente será c 
también, la salida del sistema no mostrará componentes oscilatorios entre muestras una vez alcanzado 
tiempo de asentamiento). El período de muestreo T se supone de 1 seg, es decir T= 1. 


Retén de 
orden cero 






Figura 4-75 Sistema de control digital para el problema B-4-18. 
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Análisis en el espacio 
de estado 


5-1 INTRODUCCIÓN 


En los capítulos 3 y 4 nos ocupamos de los métodos convencionales para el análisis y el diseño de los 
sistemas de control. Métodos convencionales como los del lugar geométrico de las raíces y los de 
respuesta en frecuencia, son útiles para los casos de sistemas con una entrada y una salida. Los 
métodos convencionales son conceptualmente sencillos y nada más requieren de un número razona- 
ble de cálculos, pero sólo son aplicables a sistemas lineales invariantes en el tiempo con una entrada 
y una salida. Se basan en la relación entrada—salida del sistema, es decir, en la función de transfe- 
rencia o la función de transferencia pulso. No se aplican a sistemas no lineales, excepto en casos 
simples. Asimismo, los métodos convencionales no son aplicables al diseño de sistemas de control 
óptimo y adaptable, mismos que son, en su mayor parte, variantes en el tiempo y/o no lineales. 

Un sistema de control moderno puede tener muchas entradas y muchas salidas, y éstas están 
interrelacionadas de una manera complicada. Los métodos en el espacio de estado para el análisis y 
la síntesis de sistemas de control son más adecuados para tratar con sistemas con varias entradas y 
varias salidas que se requiere que sean óptimos en algún sentido. 


Concepto del método en el espacio de estado. Este método se basa en la descripción del 
sistema en términos de n ecuaciones en diferencias o diferenciales de primer orden, que pueden 
combinarse en una ecuación matricial en diferencias o diferencial de primer orden. La utilización de 
la notación matricial simplifica en gran medida la representación matemática de los sistemas de 
ecuaciones. 

El diseño del sistema mediante el uso del concepto de espacio de estado permite al ingeniero 
diseñar sistemas de control con respecto a índices de desempeño dados. Además, el diseño en el 
espacio de estado se puede realizar para toda una clase de entradas, en lugar de una función de 
entrada específica como la función impulso, la función escalón o la función senoidal. Asimismo, los 
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métodos en el espacio de estado permiten al ingeniero incluir condiciones iniciales dentro del dise- 
ño. Ésta es una característica muy importante, que no tienen los métodos de diseño convencional. 

A continuación definiremos primero lo que es estado, variable de estado, vector de estado y 
espacio de estado, y luego presentaremos las ecuaciones en el espacio de estado. 


Estado. El estado de un sistema dinámico es el conjunto más pequeño de variables (llama- 
das variables de estado) tales que el conocimiento de dichas variables en £ = £,, junto con el conoci- 
miento de la entrada para / > £,, determinan por completo el comportamiento del sistema para cual- 
quier tiempo f 2 £,. El concepto de estado de ninguna manera está limitado a sistemas físicos; tam- 
bién se aplica en sistemas biológicos, sistemas económicos, sistemas sociales y otros. 


Variables de estado. Las variables de estado de un sistema dinámico son las que conforman 
el conjunto más pequeño de variables que determinan el estado del sistema dinámico. Si para descri- 
bir en su totalidad el comportamiento de un sistema dinámico se requiere de por lo menos n variables 
Xp Xz, <- > X, (de tal forma que una vez dada la entrada para ż > 1, y el estado inicial en £ = £,, el estado 
futuro del sistema queda completamente determinado), entonces dichas n variables se consideran un 
conjunto de variables de estado. ; 

Observe que las variables de estado no necesitan ser cantidades físicamente medibles u obser- 
vables. Aquellas variables que no representan cantidades físicas y aquellas que no se pueden medir | 
ni observar, se pueden seleccionar como variables de estado. Esta libertad en la selección de varia- 
bles de estado es una ventaja de los métodos en el espacio de estado. Sin embargo, en la práctica. lo 
conveniente es seleccionar cantidades fácilmente medibles como variables de estado, si esto fuera 
posible, ya que las leyes de control óptimo requerirán la retroalimentación de todas las variables de 
estado, con una adecuada ponderación. 


Vector de estado. Si se necesitan n variables de estado para describir completamente el com- 
portamiento de un sistema dado, entonces estas n variables de estado se pueden considerar como los 
n componentes de un vector x. Dicho vector se conoce como vector de estado. Un vector de estado 
es, por tanto, un vector que determina en forma única el estado x(/) del sistema para cualquier tiempo 
t > £,, una vez dado el estado en 1 = t, y especificada la entrada u(t) para £ > tọ. 


Espacio de estado. El espacio de n dimensiones cuyos ejes coordenados están formados por 
el eje x,, eje x,, ..., eje x, se conoce como espacio de estado. Cualquier estado puede representarse 
por un punto dentro del espacio de estado. 


Ecuaciones en el espacio de estado. En el análisis en el espacio de estado se tratará con tres 
tipos de variables que están involucradas en el modelado de sistemas dinámicos: las variables de 
entrada, las de salida y las de estado. Como se verá en la sección 5-2, la representación en el espacio 
de estado para un sistema dado no es única, con la excepción de que el número de variables de estado 
es el mismo para cualquiera de las distintas representaciones en el espacio de estado del mismo 


sistema. 
Para sistemas (lineales o no lineales) de tiempo discreto variantes en el tiempo, la ecuación de 


estado se puede escribir como 
x(k + 1) = f[x(), u(k), k] 


y la ecuación de salida como 
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y(k) = glx(K), u(k), k] 


Para los sistemas lineales de tiempo discreto variantes en el tiempo, la ecuación de estado y la 
ecuación de salida se pueden simplificar a 


x(k + 1) = G(k)x(k) + H(k)u(k) 
y(k) = C(k)x(k) + D(k)u(k) 


donde 

x(k) = vector n (vector de estado) 

y(k) = vector m (vector de salida) 

u(k) = vector r (vector de entrada) 

G(k) = matriz n x n (matriz de estado) 

H(k) = matriz n x r (matriz de entrada) 

C(k) = matriz m x n (matriz de salida) 

D(k) = matriz m x r (matriz de transmisión directa) 


La presencia de la variable k en los argumentos de las matrices G(k), H(%), C(k) y D(k) implica 
que estas matrices varían con el tiempo. Si la variable k no aparece en forma explícita en estas 
matrices, se supone que son invariables en el tiempo, es decir, constantes. Esto es, si el sistema es 
invariante en el tiempo, entonces las dos últimas ecuaciones se pueden simplificar a 


x(k + 1) = Gx(k) + Hu(k) (5-1) 
y(k) = Cx(k) + Du(k) (5-2) 


Al igual que en el caso del tiempo discreto, los sistemas de tiempo continuo (lineal o no lineal) 
se pueden representar mediante la siguiente ecuación de estado y la siguiente ecuación de salida: 


x(c) = f[x(o), u(t), t] 
y(t) = glx(c), u(e), £] 


Para sistemas lineales de tiempo continuo variantes en el tiempo, las ecuaciones de estado y de salida 
están dadas por 


x(t) = A(t)x(t) + B(t)u(t) 
y(t) = C(e)x(t) + D(e)u(t) 
Si el sistema es invariante en el tiempo, entonces las dos últimas ecuaciones se simplifican a 
x(t) = Ax(t) + Bu(t) (5-3) 
y(t) = Cx(t) + Du(t) (5-4) 


En la figura 5-1a) se muestra la representación en diagrama de bloques del sistema de control en 
tiempo discreto definido por las ecuaciones (5-1) y (5-2), y la figura 5-16) muestra el sistema de 
control en tiempo continuo definido por las ecuaciones (5-3) y (5-4). Observe que las configuracio- 
nes básicas de los sistemas en tiempo discreto y en tiempo continuo son las mismas. 
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(b) 











Figura 5-1 a) Diagrama de bloques de un sistema de control lineal en tiempo discreto invariante en el tiempo 
representado en el espacio de estado; b) diagrama de bloques de un sistema de control lineal en tiempo continuo invariante 
en el tiempo representado en el espacio de estado. 


Observe que en este libro u(k) [o bien u(ż)] denota tanto el vector de entrada a un sistema co 
el vector de control (entrada de control a una planta). Por tanto, u(k) [o u(£)] se interpreta ya 
como el vector de entrada o como el vector de control, de acuerdo con las circunstancias. 


Reseña del capítulo. La sección 5-1 presentó una introducción del método en el espacio 
estado y definió algunos términos básicos. La sección 5-2 se ocupa de varias representaciones en 
espacio de estado de sistemas lineales de tiempo discreto invariantes en el tiempo. La sección $- 
primero obtiene la solución de la ecuación de estado lineal de tiempo discreto invariante en el tie 
mediante el procedimiento de recursión y el método de la transformada z. Posteriormente pre 
un método para calcular (zI — Gy', y concluye con un análisis para la solución de la ecuación 
estado lineal de tiempo discreto invariante en el tiempo. La sección 5-4 se ocupa de la matriz de 
función de transferencia pulso. La sección 5-5 en principio trata la discretización de las ecuacio: 
en el espacio de estado lineal de tiempo continuo y luego analiza la respuesta en tiempo entre 
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“stantes de muestreo consecutivos. La sección final, sección 5-6, presenta el análisis de estabilidad 
z+ -iapunov. Empieza con la discusión de la función de Liapunov y las definiciones de estabilidad 
1+ sistemas dinámicos. Asimismo, presenta el teorema principal de estabilidad de Liapunov, seguido 


37 sus aplicaciones al análisis de estabilidad de sistemas lineales de tiempo continuo y de tiempo 
Terst 


ESENTACIONES EN EL ESPACIO DE ESTADO 
SISTEMAS EN TIEMPO DISCRETO 


Formas canónicas para ecuaciones en el espacio de estado en tiempo discreto. Existen 
T ¿Tas técnicas para obtener representaciones en el espacio de estado correspondientes a sistemas 


s o 


+" : mpo discreto. Considere el sistema en tiempo discreto descrito por 
y(k) + ay(k — 1) + a2y(k — 2) + +: + any(k — n) 


= byu(k) + byu(k — 1) +: + b ulk — n) (5-5) 
u(k) es la entrada e y(k) es la salida del sistema en el instante de muestreo k. Observe que 
1.-70s de los coeficientes a(i=1,2,...,n)yb(j=0,1,2,...,n) pueden ser cero. La ecuación 
3-5 se puede escribir en la forma de la función de transferencia pulso como 
YE) _ bot biz? +: t bz” 
U() 1+az2"+-:-+a,2" (5-6) 


E a 


goer 


ha 


Y(2) _ boz” + biz"! +.: +b, 
U(z) z" + az! + +a, (5-7) 


=xisten muchas formas de llevar a cabo representaciones en el espacio de estado para el siste- 


mui 27 tiempo discreto descrito por las ecuaciones (3-5), (5-6) o (5-7). Aquí se presentan las siguien- 
tes 


Forma canónica controlable 
Forma canónica observable 
. Forma canónica diagonal 

. Forma canónica de Jordan 


br 


: que se refiere al significado de los términos controlable y observable, vea las secciones 6-2 

La forma canónica controlable se puede obtener con el método de programación directa. (Vea 
2lema A-5-1.) La forma canónica observable se puede obtener a partir del método de progra- 
: 17. anidada. (Vea el problema A-5-2.) La forma canónica diagonal y la forma canónica de Jordan 


>: Jen obtener utilizando el método de expansión en fracciones parciales. (Vea los problemas A- 
Zo A-5-4,) 


Forma canónica controlable La representación en el espacio de estado del sistema en tiem- 


z s<reto obtenida de las ecuaciones (5-5), (5-6) o (5-7) se puede expresar en la forma dada por las 
a ines siguientes: 
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x(k +1) 0 1 0 - 0 || x(k 0 
xAk +1) 0 0 1o 0 | a(k) 0 
: s| i : : Slil 68 
Xn-i(k + 1) 0 0 0 a 1 Xa-1(k) 0 
Xn(k + 1) Ar, Tan- Tp “å; x(k) 1 
x(k) 
Y(k) = [bn — anboibn-i — bob, arbol E | + boul) 69 
xXn(k) 


Las ecuaciones (5-8) y (5-9) son las ecuaciones de estado y salida, respectivamente. La represen 
ción en el espacio de estado dada por las ecuaciones (5-8) y (5-9) se conoce comúnmente co 
Jorma canónica controlable. [Para la deducción de las ecuaciones (5-8) y (5-9) vea el problema . 
51] 

Observe que si se invierte el orden de las variables de estado, es decir, si se define nue» 
variables de estado, de acuerdo con la forma 


Xx (k) 0.0 --- 0 1 x(k) 
XAk)|_[0 0 1 0] xk) 
sw] li o --- 0 olx) 
entonces la ecuación de estado se puede escribir como sigue: 
X(k + 1) Up TUD EE ~d ci “AG, Xx (k) 1 
f(k +1) 1 0D --. 0 0 I| %(k) 0 
ĝ(k+1)j=]| 0 1. +... 0 0 11%) | +0 fu(k) (3-1 
i(k +1) 0.0.0 1 olew] lo 
La ecuación de salida se puede dar en la forma 
X (k) 
y(k) = [bi — a biba — abii- iba — abill PO | + bout) (5-1 
Xn(k) 


Las ecuaciones (5-10) y (5-11) también están en la forma canónica controlable. 


Forma canónica observable. La representación en el espacio de estado del sistema en ti 
po discreto dada por las ecuaciones (5-5), (5-6) o (5-7) se puede expresar en la forma siguiente: 


x(k + 1) 0 0 0 0 An x(k) bn > an bo 
x(k +1) 1 0 0 0 ~ani || x(k) bn-1 — an-1 bo 
f =|: i : : $ + : u(k) (5- 
Xn-ilk + 1) 0 0 1 0 —a, || x,-(k) bı — a bo 
xa(k + 1) 0 0 1 —a Xn(k) bı — a bo 
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x(k) 
x(k) 
yk) = [0 0-0 1 i |+ bulk) (5-13) 
Xn-ı(k) 
Xn(k) 


-+ “epresentación en el espacio de estado dada por las ecuaciones (5-12) y (5-13) se conoce como 
-vu canónica observable. [Para la deducción de las ecuaciones (5-12) y (5-13), vea el problema 
1.-5-2.] Observe que la matriz de estado de n x n de la ecuación de estado dada por la ecuación (5- 
- zs la transpuesta de la matriz correspondiente de la ecuación de estado definida por la ecuación 


-5 


Observe que si se invierte el orden de las variables de estado, es decir, si se definen 


Xx (k) 0 0 +++ 0 11 x(k) 
XAK)|_]0 0 >> 1 Olf xxk) 
200) Li o. ENS 
=7:7.es la ecuación de estado y la ecuación de salida se convierten en: 
+1) 
XAk +1) 
i(k +1) 
ía(k + 1) 
“A 1 0 0 0 ŝ(k) b, ~a bo 
=a o 1 0 0 XAk) b, — M bo 
ei E : ANF u(k) (S-14) 
TAn-1 0 0 0 1 Xn-1(K) ba-1 — An-1 bo 
-a 0 0 O Oj) X,(k) bn — an bo 
| (k) 
XK) 
y(«)=[1 0 >- 0 O : {+ bulk) (5-15) 
| £a = i(k) f 
| Xnlk) 


| -23 ecuaciones (5-14) y (5-15) también están en la forma canónica observable. 


Forma canónica diagonal. Si los polos de la función de transferencia pulso dados por las 
= ¿ciones (5-5), (5-6) o (5-7) son todos distintos, entonces la representación en el espacio de estado 
æ ruede expresar en la forma canónica diagonal como sigue: 


x(k +1) pı 0 © 0 ]x(k) 1 
| x(k +1)| |0 p = 0 fx(k)|, [1 u(k) (5-16) 
x(k + 1) 0O 0 << palet) 1 


www.FreeLibros.me 


300 Análisis en el espacio de estado Capítulo 5 


xi(k) 
y(k) =[c, e --* c,) x(k) + byu(k) (5-17) 
x(k) 
[Para las correspondientes deducciones de las ecuaciones (5-16) y (5-17), vea el problema A-5-3.] 


Forma canónica de Jordan. Si la función de transferencia pulso dada por las ecuaciones 
(5-5), (5-6) o (5-7) incluye un polo múltiple del orden m en z = p, y todos los demás polos son 
distintos, entonces la ecuación de estado y la ecuación de salida se pueden expresar como sigue: 


x(k +1) p1 0+ 0 | 01 [ x(k) 0 
x(k +1) 0 pi 1 -.- 0: 0 0 x(k) 0 
B EA A UA E T (5-18) 
Xm+1(k F 1) 0 0 0 Pa 0 (Pmi 0 Xm+1(k) 1 
x(k +1) 000-010 pm xy la 
x(k) 
yk =la e A |+ bulk) (5-19) 
xXn(k) 


[Las deducciones de las ecuaciones (5-18) y (5-19), aparecen en el problema A-5-4.] La matriz de 
estado de n x n está en la forma canónica de Jordan. (Para mayores detalles sobre las formas canóni- 
cas de Jordan, vea el apéndice A.) 
Ejemplo 5-1 
Considere el sistema siguiente: 
Y(z) _ z+1 
U(z) z°+1.3z + 0.4 
Las representaciones en el espacio de estado en las formas canónica controlable, canónica observable y 
canónica diagonal, se convierten en: 





FORMA CANÓNICA CONTROLABLE: 
Bej- E] sho 
y(%) =U ao] 
FORMA CANÓNICA OBSERVABLE: 
Ea e a 


£ x(k) 
y(k) = [0 1] 
FORMA CANÓNICA DIAGONAL: 


La función de transferencia pulso Y(z)/U(z) obtenida se puede expandir como sigue: 
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Y(z) 5/3 E -2/3 
U() 2+05 2+0.8 


xa(k+1)|_[|-05 0 x(k) 1 
a + J -| 0 Ol j HO 


y(k) = E -lfa 
3 3 || x2(k) 

No unicidad de las representaciones en el espacio de estado. Para un sistema con función 
z2 transferencia pulso dada, la representación en el espacio de estado no es única. Se ha demostrado 
2 existen diferentes representaciones en el espacio de estado para un sistema con función de 
Transferencia pulso. Las ecuaciones de estado, sin embargo, están relacionadas unas con otras me- 


zante una transformación de similitud. 
Considere el sistema definido por 


x(k + 1) = Gx(k) + Hu(k) (5-20) 
y(k) = Cx(k) + Du(k) (5-21) 











Y, por tanto, 


+: define un nuevo vector de estado X (A) mediante 
x(k) = Px(k) (5-22) 


zinde P es una matriz no singular. [Observe que, en vista de que tanto x(k) como x(k) son vectores 
z+ dimensión n, están relacionados uno con el otro mediante una matriz no singular.) 
Entonces, al sustituir la ecuación (5-22) en la ecuación (5-20) se obtiene 


Px(k + 1) = GPx(k) + Hu(k) (5-23) 
=-=multiplicando ambos lados de la ecuación (5-23) por P`, da 
X(k + 1) = P*GPx(k) + P”'Hu(k) (5-24) 
etniendo 


A 


PUGP=G, PUH=Á 
-¿ ¿cuación (5-24) se puede escribir como sigue: 


X(k + 1) = Gx(k) + Mu(k) (5-25) 
=Z- “orma similar, si se sustituye la ecuación (5-22) en la ecuación (5-21), se obtiene 
y(k) = CPX(k) + Du(k) (5-26) 


E 
Teniendo 


! CP=, D=D 
 =uación (5-26) se puede escribir como 


y(k) = Cx(k) + Du(k) (5-27) 


SÉ -a demostrado así que la representación en el espacio de estado dada por las ecuaciones (5-20) y 
BLIN 
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x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) + Du(k) 


es equivalente a la representación en el espacio de estado dada por las ecuaciones (5-25) y (5-27). 


X(k + 1) = Gx(k) + Ĥu(k) 
y(k) = Cx(k) + Du(k) 


Los vectores de estado x(k) y X(k) están relacionados entre sí mediante la ecuación (5-22). Dado que 
la matriz P puede ser cualquier matriz no singular de n x n, para un sistema dado existe una cantidad 
infinita de representaciones en el espacio de estado. 


En algunas aplicaciones se podría desear diagonalizar la matriz de estado G. Esto se puede 
llevar a cabo si se selecciona en forma adecuada una matriz P, de forma que 


P GP = matriz diagonal 
En el caso donde la diagonalización no sea posible, PGP puede transformarse a la forma canónica 


de Jordan: 


P-"GP = J = forma canónica de Jordan 


Refiérase al apéndice A para métodos de transformación de la matriz G a una matriz diagonal o a 
matriz en la forma canónica de Jordan. [Observe que si se utiliza el método de programación 
expansión en fracciones parciales, la matriz de estado se convierte en diagonal si todos los po! 
involucrados son distintos, y se convierte en una forma canónica de Jordan si en Y(z)/U(z) 
involucrados polos múltiples.] 


En esta sección, primero se presenta la solución de la ecuación lineal de estado en tiempo disc 
invariante en el tiempo 


x(k + 1) = Gx(k) + Hu(x) 


mediante un procedimiento de recursión y, posteriormente, a través del método de la transform 
Luego se analizan los métodos para calcular (z1 — Gy*. Por último, se resuelve la ecuación de 
lineal en tiempo discreto y variante en el tiempo 


x(k + 1) = G(k)x(k) + H(k)u(k) 


Solución de la ecuación de estado lineal en tiempo discreto e invariante en el tiempo. 
general, las ecuaciones de tiempo discreto son más fáciles de resolver que las ecuaciones dife 
les, porque las primeras pueden resolverse simplemente mediante un procedimiento de rec 
Éste es bastante sencillo y conveniente para cálculos digitales. 

Considere las siguientes ecuación de estado y ecuación de salida: 


x(k + 1) = Gx(k) + Hu(k) (5 
y(k) = Cx(k) + Du(k) (3 
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- solución de la ecuación (5-28) para cualquier entero positivo k se puede obtener directamente por 
“=¿ursión, como sigue: 

x(1) = Gx(0) + Hu(0) 

xQ) = Gx(1) + Hu(1) = G?x(0) + GHu(0) + Hu(1) 

x(3) = Gx(2) + Hu(2) = G?x(0) + G?Hu(0) + GHu(1) + Hu(2) 


''z3¡ante la repetición de este procedimiento, se obtiene 


k-1 


x(k) = G*x(0) + © G Hua(j),  k=1,2,3,... (5-30) 
j=0 


- zramente, x(k) está formado de dos partes, una que representa la contribución del estado inicial x(0) y 
a. la contribución de la entrada u( j), donde j = 0, 1,2,...,k-— 1. La salida y(k) está dada por 
k-1 


y(k) = CG*x(0) + C È G4! Hu(j) + Du(k) (5-31) 
¡=0 


Matriz de transición de estado. Observe que es posible escribir la solución de la ecuación de 
¿do homogénea 


x(k + 1) = Gx(k) (5-32) 
z7 a forma 
x(k) = ¥(k)x(0) (5-33) 
zizde W(k) es una matriz única de n x n que satisface la condición 
W(k + 1) = Gv(k), Y (0) = I (5-34) 


Z: claro que W(k) puede estar dada por 

w(k) = G* (5-35) 
Z= ¿2 ecuación (5-33), se puede ver que la solución (5-32) es simplemente una transformación del 
+:13do inicial. Por lo tanto, la matriz única W(A) se llama matriz de transición de estado. También se 
: ace como matriz fundamental. La matriz de transición de estado contiene toda la información 


:.7re los movimientos libres del sistema definidos por la ecuación (5-32). 
En términos de la matriz de transición de estado Y(k), la ecuación (5-30) se puede escribir en 


arma 
x(k) = w(k)x(0) + 5 v -j — 1)Hu(j) (5-36) 
= W(k)x(0) + È Y(j)Hu(k E (5-37) 


+ sustituir la ecuación (5-36) o la (5-37) en la ecuación (5-31), se puede obtener la siguiente ecuación 
1- salida: 
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k-1 


y(k) = CW(k)x(0) + C 2 W(k — j — 1)Hu(j) + Du(k) (3-3 


k-1 


= CW(k)x(0) + C 2 v(j)Hu(k — j — 1) + Du(k) (5-5 


Método de la transformada z a la solución de las ecuaciones de estado en tiempo discreto. 
continuación se presenta la solución de una ecuación de estado en tiempo discreto mediante el me 
do de la transformada z. Considere el sistema en tiempo discreto descrito por la ecuación (5-28 1: 


x(k + 1) = Gx(k) + Hu(k) (3 
Si se toma la transformada z de ambos lados de la ecuación (5-40) se obtiene 
zX(z) — zx(0) = GX(z) + HU(z) 
donde X(2) = Z[x()] y U(z) = Z'[u(K)]. Entonces 
(z1 — GX(2) = zx(0) + HU(z) 
Premultiplicando ambos lados de esta última ecuación por (zI — G)”', se obtiene 
X(2) = (zI — G)*2x(0) + (21 — G)*HU(z) 
Al tomar la transformada inversa z en ambos lados de la ecuación (5-41), da 
x(k) = 2 "[G1 — G) z]x(0) + 2[(21 — G) * HU(2)] 
Al comparar la ecuación (5-30) con la ecuación (5-42), obtenemos 


G* = Z (21 — G) z] 


k-1 


Y G4 Hu(j) = Ziz - G) HU(2)] 


j=0 
donde k=1,2,3,.... 
Observe que la solución del método de la transformada z involucra el proceso de invertir la 


(zI - G), lo que puede realizarse mediante métodos analíticos o utilizando una rutina de compu 
La solución también requiere de las transformadas inversas z de (zI — G)” z y (zI —- G)” HU(=¿ 


Ejemplo 5-2 
Obtenga la matriz de transición de estado del siguiente sistema en tiempo discreto: 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 


0 1 1 y 
[das al a-[1, Cm 


Posteriormente obtenga el estado x(k) y la salida y(k) cuando la entrada u(k) = 1 para k= 0, 1.2.. 
Suponga que el estado inicial está dado por 


o- [o] L] 
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De las ecuaciones (5-35) y (5-43), la matriz de transición de estado V(k) es 
W(k) = G =2 "(21 - G)'z] 


Por tanto, primero se obtiene (z1 — Gy”: 


-1 
Ay z -1 
GEAG) e ll 


z+1 1 
_|G+ 0.21(2 + 0.8) (z + 0.2)(2 + 0.8) 
0.16 z 


(z +0.2)(z + 0.8) (z +0.2)(z + 0.8) 


5 


3 
.8 t02 zF 


2 
3 


ua 
tala 





202 2 











+ 
o 
o 


8 


Il 


—08 


ES 


AAA ES AAA SA 
2102 2+08 2+02 2+08 


-l 


© 
-Ag 
vte 


La matriz de transición de estado “Y(k) se obtiene ahora como sigue: 








4 z A Z $22 0 5 Z 

= 7- 3z +02 32+0.38 32+02 3z+0.8 
D E E E A TE DET EE 

3 z+0.2 3 2+0.8 32+02 32+0.38 


1(-0.2)' — 1(-0.8)' $(-0.2)' ~ ¿(-0.8)' 
= (5-45) 
-28(-0.2)* + 28(-0.8)* —}(-0.2)* + 4(—0.8) 


La ecuación (5-45) da la matriz de transición de estado. 
Ahora, se calcula x(k). La transformada z de x(k) está dada por 


Z{x(k)] = X(z)} = (zI - G) zx(0) + (21 - G) 'HU(z) 
= (21 — G) '[zx(0) + HU(2)] 











Dado que 
1 z 
10771 
se obtiene $ z 
Z z-1 z 1 
zx(0) + HU(2) = E F z = SAE 
| Zo 
Por tanto 


li 


X(2) = (21 — G)`'[zx(0) + HU(2)] 


(z? + 2)z 
(z + 0.2 + 0.8Xz — 1) 
(=z? + 1.84z)z 


(z + 0.2(z + 0.8)X(z — 1) 
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-1 22 25 
Ez + Fz 7 
_[z2+02 z+08 2z-1 
3.4 — 17.6 kA 
52 +72 182 











2+02 2+08 z-1 


Por tanto, el vector de estado x(k) está dado por 
a e + Avd +2 
(0.2) - BS(-08) + $ 
Finalmente, la salida y(k) se obtiene como sigue: 
-2 (0.2 + 2(-0.8)* + 3 
y(k) = Cx(k) 


[1 0] 
34 (—0.2)* — 144 (—0.8)" + yy 
-2 (—0.2)* + 2(-0.8) + E 


Cálculo de (z1 — Gy*. La solución de la ecuación de estado dada por la ecuación (5-28 
mediante el método de la transformada z requiere del cálculo de (z1 — GY". El cálculo de (zł —- GY 
por lo general, una tarea que toma mucho tiempo, excepto en casos simples. Existen métodos t 
analíticos como de cómputo para el cálculo de (zI — GY". Aquí se presenta uno. 


Método para calcular (z1— GY’. Este método está basado en la expansión de la adjunta 

(zI — G). La inversa de (zI — G) se puede escribir en términos de la adjunta de (zI — G), como sigu 

adj] (zI — G) 
|zI — G| 


Observe que en el determinante |zI — G| se puede escribir como sigue: 


th 


(zI - G)! = ( 


|zI —- G| = z” + az"! + az"? +- +a, (547 


Se puede demostrar (vea el problema A-5-13), que adj(zl — G) se puede obtener mediante 


adj (zI — G) = Iz" + Hiz"? + Hz" +- + Hp (5 
donde 
H,=G+ajl 
H, = GH, + al 
(5 
H,- = GH,., + aI 
H, = GH,- +a, I= 0 
Observe que a,, a,, .. ., a, son los coeficientes que aparecen en el determinante dado por | 


ecuación (5-47). Las a, también se pueden obtener (vea el problema A-5-13) mediante el empleo 


la traza, como sigue: 
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a = -trG 

a, = —-3trGH, 

az = — 4 tr GH, (5-50) 
1 

Qi. === tr GH,- 
n 


(La traza de una matriz de n x n es la suma de sus elementos diagonales.) 

Para un determinante de orden superior (n > 3), la expansión del determinante |z1 — G| en la 
forma dada por la ecuación (5-47) puede ocupar mucho tiempo, en este caso, resulta útil emplear la 
ecuación (5-50) para calcular las a, ya que a,, H,, a,, H,, .. ., ap- H, _, se pueden calcular 
fácilmente de manera secuencial. 

Al sustituir la ecuación (5-49) en la ecuación (5-48) y sustituyendo la ecuación resultante en la 
ecuación (5-46), se obtiene la inversa de (zI — G). Este método es conveniente para soluciones en 
computadora; ya existe un programa estándar. 


Ejemplo 5-3 
Determine la inversa de la matriz (zE — G), donde 
0.1 0.1 0 
G=|0.3 -0.1 -—0.2 
0 0 0.3 
También obtenga G". 
De las ecuaciones (5-46), se tiene 
_ m- _ 2dj (zI - G) 
(zI - G) Ha=a Tol 


A pesar de que el determinante |zI — G| se puede expandir fácilmente, utilizaremos aquí, para efectos de 
demostración, la ecuación (5-50) para el cálculo de a,, a, y az. Primero observe que 


0.1 0.1 0 
a = —trG = —tr| 0.3 -—0.1 -—0.2]= 0.3 
0 0 —0.3 


Entonces, de la ecuación (5-49), se obtiene 


01 01 0 03 0 0 
H=G+al=jf03 -01 -02|+|0 03 0 
0 0 -03 0 0 03 


04 01 0 
=|0.3 0.2 -—0.2 
0 0 0 
Por tanto 0.1 0.1 0 0.4 0.1 0 


" 


—¿trGH, = -¿tr4]0.3 —0.1 -0.2||0.3 0.2 -0.2 
o 0 -o3f0o 0 0 


0.07 0.03 —0.02 
—1tr| 0.09 0.01  0.02|= —0.04 
0 0 0 


a2 
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Si se sustituye la matriz H, y el valor de a, que se acaba de obtener en la ecuación (5-49) se obtiene 
0.03 0.03 —0.02 
H, = GH, + a, = | 0.09 —0.03 0.02 
0 0 0.04 


0.012 0 0 
as = —} tr GH, = -¿trjó0 0.012 0 = —0.012 
0 0 0.012 
Observe que 


H; — GH, — 0.091 =0 
La adjunta de (zI — G) se puede dar ahora mediante la ecuación (5-48), es decir 
adj (zI — G) = 12? + Hiz + H: 


100 0.4 0.1 0 0.03 0.03 —0.02 
=|0 1 0[22+]|0.3 0.2 -—0.2|z +]0.09 —0.03 0.02 
0.0 1 0 0 0 0 0 0.04 
z? + 0.4z + 0.03 0.1z + 0.03 —0.02 
= | 0.3z + 0.09 z? + 0.2z — 0.03 —0.2z + 0.02 
0 0 z? — 0.04 
También, 
|zI — G| = 2° + az? + azz + a3 = z° + 0.3z?° — 0.04z — 0.012 
= (z + 0.2)(z — 0.2)(z + 0.3) 
Por tanto, 
ma _ dj (zI - G) 
(0) izl — G] 
z+0.1 0.1 0.02 
EFO2DME-02) (+02 02) (2 +0.2)(2 —0.2(z + 0.3) 
0.3 z-0.1 —0.2(z — 0.1) 
(z +0.2)X(z - 0.2) (2 +0.2X(z — 0.2) (z +0.2X(z — 0.2)(z + 0.3) 
1 
E f z +0.3 


Esta última ecuación da la inversa de (zI — G). 
A continuación, se obtendrá G*. De la ecuación (5-43), se tiene 


G* = Z ~'[(z1 - G)*2] 


0.25z 0.75z 0.252 A 0.25z 0.5z 0.1z 0.4z 














z+0.2 z-02 2+02 z-02 z+02 z-02 z+03 
da 0.752 eN 0.752 0.75z 0.25z 1.52 0.1z 1.6z 

















2+02 2z-02 2+02 2-02 z+02 2-02 2+0,3 








zZ 


9 y z +0.3 
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0.25(-0.2)* + 0.75(0.2)* —0.25(-0.2)* + 0.25(0.2)* 
= | -0.75(-0.2)* + 0.75(0.2)* — 0.75(-0.2)* + 0.25(0.2)* 
0 0 


0.5(-0.2)* — 0.1(0.2)* — 0.4(-0.3)* 
-1.5(-0.2)* — 0.1(0.2)* + 1.6(-0.3)* (5-51) 
(-0.3)* 















Solución de las ecuaciones de estado lineales en tiempo discreto y variantes en el tiempo. 
1s:dere la siguiente ecuación de estado lineal en tiempo discreto y variante en el tiempo junto con 
=rrespondiente ecuación de salida: 


x(k + 1) = G(k)x(k) + H(k)u(k) (5-52) 
y(k) = C(k)x(k) + D(k)u(k) (5-53) 
æ sc ción de la ecuación (5-52) se puede encontrar fácilmente mediante recursión, como sigue: 
x(h + 1) = G(h)x(h) + H(A)Ju(h) 
x(h + 2) = G(h + Dx(h + 1) + H(h + Du(A + 1) 
= G(h + 1)G(h)x(h) + G(h + 1)H(HJu(A) + H(h + Du(h + 1) 


-3 matriz de transición de estado (matriz fundamental) para el sistema definido por la ecuación 
SI s define como ¥(k, h). Se trata de una matriz única, que satisface las condiciones 


W(k + 1,h) = G(k)V(k,h),  Y(h,h) =I 


«=h.h+1,h+2,... Se puede ver que la matriz de transición de estado V(k, 4) está dada por 
ación 


W(k,h) = G(k — 1)G(k — 2) - - G(h), k>h (5-54) 
do Y(k, h), la solución de la ecuación (5-52) se convierte en 


x(k) = W(k, h)x(h) + Swej + DH(j)u(j), k>h (5-55) 


+3 que el primer término segundo miembro de la ecuación (5-55) es la contribución del esta- 
zzzi x(4) al estado actual x(k), y que el segundo término es la contribución de la entrada u(»), 


Ti... U(k- 1). 
Zs facil verificar la ecuación (5-55). En referencia a la ecuación (5-54), se tiene 
YW(k + 1,h) = G(k)G(k — 1)---G(h) = G(kY¥(k, h) (5-56) 


sosttuve la ecuación (5-56) en 
k 

x(k + 1) = W%(k + 1,h)x(4) + È V(k + 1,j + DUU) 
j=h 


k-1 


x(k + 1) = GKY (k, h)x(h) + 2 W(k + 1,5 + DUC) 


+ Ww(k + 1,k + 1)H(k)u(k) 
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= Go| wk, 10209) + È YQ, j + DHG Jul »| + H(k)u(k) 
= G(k)x(k) + H(k)u(k) 


Por tanto, se ha demostrado que la ecuación (5-55) es la solución de la ecuación (5-52). 
Una vez obtenida la solución de x(k), la ecuación de salida, ecuación (5-53), se convierte en: 
k-1 


y(k) = C(kYP(k,h)x(h) + 2 C(kyV(k,j + 1)H()Ju( y) + D(k)u(k), k>h 


Si G(k) es no singular para todos los valores de k considerados, de forma que la inversa de 
V(k, h) exista, entonces la inversa de W(K, h), denotada como ¥(h, k), está dada como sigue: 


Wok, h) = W(h, k) 
= [G(k — 1)G(k — 2)---G(h)]" 


=GUN)G Uh + 1): Gk — 1) (5-57) 
Resumen sobre V(k, h). Un resumen de la matriz de transición de estado (k, ») da lo 
siguiente: 
1. VA =I 


2. Y(k, h) =G(k- 1)G(k- 2) : -+ G(h), k>h 
3. Si la inversa de W(k, h) existe, entonces 


Wo (k,h) = W(h,k) 
4. Si G(K) es no singular para todos los valores de k considerados, entonces 
Pok, D= Pek, NYG, D, para cualquier į, j, k 
Si G(ķ) es singular para cualquiera de los valores de k, entonces 


Pek, D= Y(k YFG, D, para k>j>i 
5-4 MATRIZ DE FUNCIÓN DE TRANSFERENCIA PULSO 


Un sistema en tiempo discreto de una entrada y una salida se puede representar o modelar mediante 
una función de transferencia pulso. La extensión del concepto de la función de transferencia pulso a 
un sistema en tiempo discreto de varias entradas y varias salidas da la matriz de función de transfe- 
rencia pulso. En esta sección se estudiará la relación entre la representación en el espacio estado y la 
representación mediante la matriz de función de transferencia pulso. 


Matriz de función de transferencia pulso. La representación en el espacio de estado de un 
sistema lineal en tiempo discreto e invariante en el tiempo de orden n, con r entradas y m salidas, se 
puede dar mediante 


x(k + 1) = Gx(k) + Hu(k) (5-58) 
y(k) = Cx(k) + Du(k) (5-59) 
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axr + x/k) es un vector-n, u(A) es un vector-"r y y(k) es un vector-m, G es una matriz de n x n, H es 
E Tatriz de n x r, C es una matriz de m x n y D es una matriz de m x r. Al tomar las transformadas 
== zs ecuaciones (5-58) y (5-59), se obtiene 


zX(z) — zx(0) = GX(2) + HU(2) 
Y(z) = CX(z) + DU(2) 


des<7.2 que la definición de función de transferencia pulso exige la suposición de condiciones 
x 2.25 cero, aquí también suponemos que el estado inicial x(0) es cero. Entonces se obtiene 


X(2) = (21 — G) HU(z) 
Y (2) = [CI - G) H + DJU(Z) = F(z)U(z) 


F(z) = C(z1 — G) `H + D (5-60) 
lz s< conoce como matriz de función de transferencia pulso. Se trata de una matriz de m x r. La 


7 Ze función de transferencia pulso F(z) caracteriza la dinámica de entrada/salida del sistema de 
Tr“ Ziscreto dado. 


=7 vista de que la inversa de la matriz (z1 — G) se puede escribir en la forma 
adj (21 — G) 
Iz1 — GJ 
mz de función de transferencia pulso F(z} se puede dar mediante la ecuación 
C adj (zI — G)H 
|zīI — Gl 


7: que los polos de F(z) son los ceros de |zl — G| = 0. Esto significa que la ecuación caracterís- 
+ sistema en tiempo discreto está dada por 


(21 - 6)! = 


F(z) = +D 


lz1-G|=0 
z" + azm! + az"? + +4, 2+0,=0 


= 2s coeficientes a, dependen de los elementos de G. 
Transformación de similitud. Se ha demostrado que para el sistema definido por 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) + Du(k) 
z de función de transferencia pulso es 
F(z) = C(21 -— G)'H + D 


b z =cción 5-2 se mostró que varias representaciones en el espacio de estado distintas para un 
z žado están interrelacionadas por una transformación de similitud. Al definir un nuevo vector 
2: 1 «3 utilizando una matriz de transformación de similitud P, es decir 
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x(k) = Px(k) 
donde P es una matriz no singular de n x n, se tiene 
X(k + 1) = Gx(k) + Ĥu(k) (5-61) 
y(k) = Cx(k) + Du(k) (5-62) 
donde G, H, C, D y G, ñ, C, D, están relacionadas, respectivamente, mediante 
P-GP = Ĝ 
PH 
CP 
D = ĎÔ 


La matriz de función de transferencia pulso F(z) para el sistema definido por las ecuaciones (5-61) 
y (5-62) es 


Ho l 
Cr Te 


Ê(z) = Ĉ(zI - Ĝ)' Ê + Ô 
Observe que las matrices de función de transferencia pulso F(z) y Fw son iguales, en vista de que 
F(z) = (1 - G) "A + Ô = CP(zI — P GP) PH + D 
= CP(2P — GP)*H + D = C(zPP™ ~ GPP H + D 
= C(zI — G)'H + D = F(z) 


Por tanto, la matriz de función de transferencia pulso es invariante bajo una transformación de sim- 
litud. Es decir, no depende del vector estado determinado x(k) seleccionado para la representación 
del sistema. 

La ecuación característica [zl — G| = 0 también es invariante bajo una transformación de simá 
litud, ya que 


Izl — G| = |P™|jzI — GP] = [21 — P~! GP] = |z1 — ĈI 


Por tanto, los valores característicos de G son invariantes bajo una transformación de similitud. 


En el control digital de plantas en tiempo continuo es necesario convertir ecuaciones en el espacio 
estado en tiempo continuo, en ecuaciones en el espacio de estado en tiempo discreto. Se p 
realizar dicha conversión si se introducen en los sistemas en tiempo continuo muestreadores y 
positivos de retención ficticios. El error introducido por la discretización se puede hacer despr 
utilizando un período de muestreo suficientemente pequeño en comparación con la constante 
tiempo más significativa del sistema. 


Repaso de la solución de las ecuaciones de estado en tiempo continuo. Primero se revi 
la matriz exponencial e^. La matriz exponencial se define como 





1 1 SA 
At — > A22 ... + A“ Tonym 
e= 1+ At +A + PAF 27 
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Debido a que la serie finita 2_,A*1' /k converge, la serie se puede diferenciar término por 
10 para dar 


d a sr Ar Atte! 
L£ Ar — O A ss 
die A + A't + z t TESI 
A? t? ALA gt 
= .... ——— +... = At 
alte ar E 21 + Eee | Ae 
Ae Algk! | 
I+ p E O A = e^ 
= 1 At 21 «=D A=e"%A 


La matriz exponencial tiene la propiedad de que 


eA(+s) = e! As 


Ex- se puede probar como sigue: 


A 


k=0 k=0 zİ!(k — 





z > Ak (t 1 = e^“) 
k=0 - 


zarticular, si s = —ż, entonces 
e At¿—Al E e™ e" = e2t=o =I 


er zanto, la inversa de e* es e". Dado que siempre existe la inversa de e^, e* es no singular. 
Es importante apuntar que 


e^t) = e^ e! si AB = BA 
PE E e^ eP, si AB + BA 
A continuación se obtendrá la solución de la ecuación de estado en tiempo continuo 
x = Ax + Bu (5-63) 


ne x es el vector de estado (vector n), u es el vector de entrada (vector r), A es una matriz 
xante de n x n, y B es una matriz constante de n x r. 
Si la ecuación (5-63) se escribe en la forma 


x(t) — Ax(t) = Bu(t) 


zremultiplicamos ambos lados de esta última ecuación por e“, obtenemos 


e*Mx(t) — Ax(0)] = £ enx) = e" Bu(t) 


zzəgrar la ecuación anterior entre 0 y £, da 


e^ x(t) = x(0) + e *"Bu(r) dí 


Iir 


x(t) = e™x(0) + fen Bu(7) dr (5-64) 
0 
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La ecuación (5-64) es la solución de la ecuación (5-63). Observe que la solución de la ecuación de 
estado que comienza en el estado inicial x(1,) es 


t 
x(t) = e x(t9) + Í e^? Bu(r) dr (5-65) 
to 
Discretización de las ecuaciones en el espacio de estado en tiempo continuo. Ahora se 
presentará un procedimiento para la discretización de ecuaciones en el espacio de estado en tiempo 
continuo. Se supone que el vector de entrada u(/) cambia sólo en instantes de muestreo uniforme- 
mente espaciados. Observe que la operación de muestreo aquí es ficticia. Se deducirá una ecuación 
de estado en tiempo discreto y una ecuación de salida que den como resultado los valores exactos en 
t= kT, donde k=0,1,2,... 
Considere la ecuación de estado en tiempo continuo y la ecuación de salida 


x = Ax + Bu (5-66) 


y = Cx + Du (5-67) 


En el siguiente análisis, con el objeto de simplificar la presentación, se utilizará la notación kT y (k — 
1)T en vez de k y k + 1. La representación en tiempo discreto de la ecuación (5-66) tomará la forma 


x((k + 1)T) = G(T)x(kT) + H(T)u(kT) (5-68) 


Observe que las matrices G y H dependen del periodo de muestreo T. Una vez fijo el período de 
muestreo T, G y H son matrices constantes. 

Para determinar G(T) y H(7)), se utiliza la ecuación (5-64), solución de la ecuación (5-66). Se 
supone que la entrada u(í) es muestreada y alimentada a un retenedor de orden cero, de forma que 
todos los componentes de u(t) sean constantes en el intervalo entre dos instantes de muestreo conse- 
cutivos cualesquiera, es decir 


u(t) = u(kT), para kT<t<kT+T (5-69) 
En vista de que 
(+ 1DT 
x((k + 1)T) = e**1Tx(0) + ento f e "Bu(r) dr (5-70) 
0 
y 
kT 
x(kT) = e™"x(0) + en | e"Bu(r) dr (5-71) 
0 


al multiplicar la ecuación (5-71) por e* y sustraerla de la ecuación (5-70) nos da 


(k+1)T 
x((k + 1)T) = e^ x(kT) + enter | e *"Bu(r) dr 


k 
kT 
Dado que la ecuación (5-69) u(t) = u(kT) para ÁT < t < kT + T, se puede sustituir u(7) = u(kT) = 
constante en esta última ecuación. [Observe que u(/) puede tomar un valor en £ = ÁT + T, es decir, 
u(kT + T), que puede ser distinto de u(k7). Este valor en u(7) con r= kT + T, que es el límite superior 
de la integración, no afecta el valor de la integral en esta última ecuación, ya que el integrando no 
incluye funciones impulso.] Por lo tanto podemos escribir 
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T 
x((k + 1)T) = e" x(kT) + erf e *Bu(kT) dt 
0 
















To 
= ex(xT) + | ePBu(kT) da (5-72) 
0 
m2 À= T-t. Si se definen 
G(T) = e? (5-73) 
T 
H(T) = (f e da) (5-74) 
0 
ær ices la ecuación (5-72) se convierte en 
x((k + 97) = G(T)x(kT) + H(D)u(kT) (5-75) 


«uc żs la ecuación (5-68). Entonces, las ecuaciones (5-73) y (5-74) dan las matrices deseadas G(T) 
s H 7. Note que G(7) y H(7) dependen del período de muestreo T. Con referencia a la ecuación (5- 
é`  z ecuación de salida se convierte en 


y(kT) = Cx(kT) + Du(kT) (5-76) 


m2: las matrices C y D son matrices constantes y no dependen del período de muestreo T. 
Si la matriz A es no singular, entonces H(7) dada por la ecuación (5-74) se puede simplificar 


j T 
H(T) = Ú erda B = Ae” — I)B = (e — I)A™! B 
0 
Comentarios 


=x el enfoque del espacio de estado, observe que al suponer el vector de entrada u(A constante 
atre dos instantes de muestreo consecutivos cualesquiera, la representación en tiempo discre- 
12 se puede obtener simplemente integrando la ecuación de estado en tiempo continuo sobre 
-7 período de muestreo. La ecuación de estado en tiempo discreto dada por la ecuación (5-68) 


se conoce como equivalente con retenedor de orden cero de la ecuación de estado en tiempo 
-ntinuo dada por la ecuación (5-66). 


ya 


~- general, para convertir la ecuación de un sistema en tiempo continuo en una ecuación de un 
s's:ema en tiempo discreto, es necesario algún tipo de aproximación. Es importante apuntar 
z-e la ecuación (5-75) no incluye ninguna aproximación, siempre que el vector de entrada u(1) 
xz constante entre dos instantes de muestreo consecutivos cualesquiera, tal y como se supuso 
+" a deducción. 

3 serve que para T<< 1, G(T) + G(0) = e^ = I. Por tanto, conforme el período de muestreo T 
æ nace muy pequeño, G(T) se aproxima a la matriz de identidad. 


34 
<: -sidere el sistema en tiempo continuo dado por 


-%9 _ 1 
G= DE. «+. 
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Obtenga la representación en el espacio de estado en tiempo continuo de este sistema. Luego discretice la 
ecuación de estado y la ecuación de salida y obtenga la representación en el espacio de estado en tiempe 
discreto del sistema. También obtenga la función de transferencia pulso del sistema mediante el empleo 
de la ecuación (5-60). 

La representación en el espacio de estado en tiempo continuo del sistema es simplemente 


X= -ax+u 


YX 
Ahora se discretiza la ecuación de estado y la ecuación de salida. Con referencia a las ecuaciones (35-734 
y (5-74), se tiene 


G(T) = e°" 
T 


H(T) -=Í ed) = 


0 


1 = e? 


Por tanto, la versión discretizada de las ecuaciones de este sistema es 


u(k) 


e T 


1 Es 
x(k +1) =e x(k) + E 
y(k) = x(k) 
Con referencia a la ecuación (5-60), la función de transferencia pulso para este sistema es 


F(z) = C(zI - Gy*H 
apogilo e Uen 
=(2-e”) a Taller 


Este resultado concuerda con la transformada z de G(s) cuando está precedida por un muestreador 
y un retenedor de orden cero [es decir, en donde la señal u(t) se muestrea y alimenta a un retenedor de 
orden cero antes de que sea aplicada a G(s)]: 


oll-e” 1 PE 1 
z| sS l-a $ zll 


A 1 
call-e 20) 





G(z) 


Ejemplo 5-5 
Obtenga las ecuaciones de estado y de salida en tiempo discreto y la función de transferencia pulso 
(cuando el período de muestreo T = 1) del sistema en tiempo continuo siguiente: 


O 
U(s)  sí(s +2) 
mismo que se puede representar en el espacio de estado mediante las ecuaciones 


lo ll 
yl al] 


La ecuación de estado en tiempo discreto deseada tendrá la forma 


it AELOSCOMED + HD UT) 


G(s) = 
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donde las matrices G(7) y H(7) se obtienen a partir de las ecuaciones (5-73) y (5-74) como sigue: 


amor [ 105% 





0 e? 
T T pt 1 ET -1 
e i e 
Por tanto, H1-e?) 
1 e? Ye 1 
a+ yn] Ti ae ar) lr E) 
EN s DD) [o en la ja e en Sid 


La ecuación de salida se convierte en 
Z xı(kT) 
y(kT)=[1 asan 


Cuando el período de muestreo es de 1 segundo, es decir, T = 1, la ecuación de estado en tiempo discreto 
y la ecuación de salida se convierten, respectivamente, en 


¡(+ 1] _ [1 0.4323] x(k) , [0.2838 
las + 7 . E al ä as lw 


x(k) 

k)=[1 0 

y(k) =Í a 

La representación en la función de transferencia pulso de este sistema se puede obtener a partir de la 
ecuación (5-60), como sigue: 

F(z) = C(21- G)'H+D 


-1 
o 2-1 0.4323 Į [0.2838 
=R of 0 z- el le Ms 


Ad 0.4323 
=p 017271 E7 DG - 0.1353) les) 
0 1 0.4323 
z — 0.1353 
_ 0.2838z + 0.1485 
(2 ~ 1) — 0.1353) 
_ 0,2838z ' + 0.1485z ~? 
(1-24 - 0.135327') 
Observe que se puede obtener la misma función de transferencia pulso si se toma la transformada z de 
G(s) cuando está precedida de un muestreador y un retenedor de orden cero. Al suponer T= 1, se obtiene 


e 1- er 1 _ — -iye paano A 
G(z) -z| s s(s+ 5) pa 7 T 5] 
0.5 0.25 0.25 
Ma = aF tys e a 
=(1-z yzl A +22] 
Oa E 2 DOS O 025 
=(1-2 E 7 y 1-27 A 1 — 0.1353z 7? 
(1-24 - 0.1353z~') 
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Enfoque de MATLAB para la discretización de ecuaciones de estado en tiempo contin 
MATLAB tiene un comando muy útil para discretizar una ecuación de estado en tiempo continue 
x = Ax + Bu 
y convertirla a 


x(k + 1) = Gx(k) + Hu(k) 


El comando MATLAB para discretización es 


[G,H] = c2d(A,B,T) 


donde T es el período de muestreo del sistema en tiempo discreto. T se deberá especificar en segun 
Si se requiere de buena precisión en la obtención de G y de H utilice format long. Si solam 
se necesitan cuatro decimales, utilice format short. Si no se incluye enunciado de formato en 
programa, MATLAB producirá G y H en format short. 
Considere el ejemplo siguiente: si el sistema en tiempo continuo está dado por 


al-s EIE . 


entonces, al considerar que el período de muestreo es de 0.05 segundos, se obtienen G y H co: 
sigue: 











A=[0 1;-25 
B = [0;11; 
[G,H] = c2d(A,B,0.05) 


-4); 





G= 


0.9709 0.0448 
—1.1212 





Observe que la matriz de estado G y la matriz de entrada H de la ecuación en el espacio 
estado de tiempo discreto 


x(k + 1) = Gx(k) + Hu(k) 


dependen del período de muestreo T. Por ejemplo, considere la discretización del sistema en tiem 
continuo dado por la ecuación (5-77) con dos períodos de muestreo distintos: T = 0.2 segundos y 
= ] segundo. Como se ha visto en las salidas de MATLAB anteriores y en las que siguen, un conj 
to de matrices G y H difieren en función de un período de muestreo T diferente. 
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A=[0 1;-25 -4); 
B = [0;1); 
[G,H] = c2d(A,B,0.2) 


A=[0 1;-25 -4); 
B = [0;1); 
[G,H] = c2d(A,B,1) 





G = G = 
0.6401 0.1161 —0.0761 
2.9017 0.1758 0.7321 
H= 
0.0144 
0.1161 








Como otro ejemplo, veamos el siguiente sistema: 


x= Ax + Bu 
AA AER 
0. 100 0 
| 20.601 0 0 0 Moda 
AS o E 
-0.4905 0 0 0 0.5 


¿Toner que el período de muestreo T es de 0.5 segundos y sin especificar el formato, se obtiene 
: ¿ente ecuación de estado en tiempo discreto: 


x(k + 1) = Gx(k) + Hu(k) 
z4 as matrices G y H se pueden encontrar en la siguiente salida de computadora: 


A=1[0 1 0 
20.601 0 0 
0 0 0 
0.4905 0 0 
B = [0;-1;0;0.5]; 
[G,H] = c2d(A,B,0.05) 


ol; 


G= 


0.0504 0 0 


1.0259 0 0 
0.0000 1.0000 0.0500 
—0.0006 0 1.0000 
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Respuesta en tiempo entre dos instantes de muestreo consecutivos. En un sistema en tiem- 
po continuo muestreado, la salida es constante en el tiempo. Como se vio en los capítulos 3 y 4, la 
solución mediante la transformada z de la ecuación del sistema en tiempo discreto da la respuesta de 
la salida sólo en los instantes de muestreo. En la práctica, se puede desear determinar la salida entre 
dos instantes de muestreo consecutivos. Existen algunos métodos para encontrar la respuesta (sali- 
da) entre dos instantes de muestreo consecutivos, como el método de la transformada de Laplace y el 
método de la transformada z modificada (vea el apéndice B). Aquí se demostrará cómo se puede 
modificar fácilmente el método en el espacio de estado para obtener la salida entre dos instantes de 
muestreo consecutivos cualesquiera. 

Considere el sistema en tiempo continuo invariante en el tiempo definido por 


x = Ax + Bu 
y = Cx + Du 


Se supone que la entrada u se muestrea y alimenta a un retenedor de orden cero. Entonces u(7) = 
u(kT) para kT < 7<kT+ T. Con referencia a la ecuación (5-65), la solución de la ecuación de estado 
que comienza con el estado inicial x(,) es 


t 
x(t) = ex x(t) + Í e^t- Bu(r) dr 
to 


Para obtener la respuesta del sistema muestreado en t = kT + AT, donde 0 < AT < T, se hace que t= 
kT + AT, to = kT y u(7) = u(kT) en la solución x(£). Entonces, 
kT+AT 
XT + AT) = e^Tx(kT) + | eerta -> Bu(kT) de 
kT 
AT 
= eMIx(kT) + f e” Bu(kT) dà 
0 


donde A = kT + AT - 7. Se define 


G(AT) = e*27 (5-78) 
AT 
H(AT) = Í en d )B (5-79) 
0 
Por tanto, se obtiene 
x(kT + AT) = G(AT)x(kT) + H(AT)u(kT) (5-80) 


La salida y(A7 + AT) se puede dar mediante 
y(kT + AT) = CX(kT + AT) + Du(kT) 
= CG(AT)x(kT) + [CH(AT) + DJu(kT) (5-81) 


Por tanto, los valores de x(AT + AT) y y(kT + AT) entre dos instantes de muestreo consecutivos 
cualesquiera se pueden obtener si se calcula G(AT) y H(AT) para varios valores de AT, donde 0 < AT 
< T, y se introducen dichos valores calculados en las ecuaciones (5-80) y (5-81). (Estos cálculos se 
pueden programar fácilmente en una computadora digital.) 
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Ejemplo 5-6 
Considere el sistema analizado en el ejemplo 5-5. Obtenga la ecuación de estado en tiempo discreto asi 
como la ecuación de salida en t= k7+ AT. También obtenga las expresiones especificas correspondientes 
a la ecuación de estado y la ecuación de salida cuando T= 1 segundo y AT = 0.5 segundos. 

En el ejemplo 5-5, se obtuvieron las matrices G(T) y H(7) como sigue: 


Mia ar 
ol 
1 e”T-1 
H(T) = r+ 2 ) 
ja = e77) 


Para obtener la ecuación de estado y la ecuación de salida en / = kT + AT, donde 0 < AT < T, primero se 


convierte G(T) en G(A7) y H(7) en H(A7), y luego se sustituye G(AT) y H(A7) en las ecuaciones (5-80) 
y (5-81), como sigue: 


1 1 e? -1 
aT+aml_ |1 ha - e leer) Mars 5) 
ay nl an 
y(«T + AT) = [1 of au a deal 
1 e 247 -1 
+10 Mar 2 la 


ICI = e7247) 


Para T= 1 y AT = 0.5 se obtiene la ecuación de estado y la ecuación de salida como sigue: 


x(k +0.5)]_ [1 0.3161 [0.049] _ [0.0920 
ls + +] E E | Ñ KAG 
x(k) 


y(k + 0.5) = [1 osien z 


| + (0.0920)u(k) 


SIS DE ESTABILIDAD DE LIAPUNOV 





Z análisis de estabilidad de Liapunov juega un papel importante en el análisis de la estabilidad de 
as sistemas de control descritos por ecuaciones en el espacio de estado. Existen dos métodos de 
ara isis de estabilidad de Liapunov, llamados primer método y segundo método; ambos se aplican 
ram determinar la estabilidad de los sistemas dinámicos descritos por ecuaciones diferenciales o en 
z “arencias ordinarias. El primer método está formado por procedimientos en los que se utilizan las 
nas explícitas de las soluciones de las ecuaciones diferenciales o de las ecuaciones en diferencias 
zan el análisis. Por otra parte, el segundo método no requiere de las soluciones de las ecuaciones 
z Tarenciales o en diferencias, por lo que resulta más útil en la práctica. 

Aunque existen muchos criterios de estabilidad poderosos para los sistemas de control, como 
sr el criterio de estabilidad de Jury y el criterio de estabilidad de Routh—Hurwitz, éstos están 
==Tingidos a sistemas lineales invariantes en el tiempo. Por otro lado, el segundo método de Liapunov 


www.FreeLibros.me 


322 Análisis en el espacio de estado Capítulo 5 


no está limitado a sistemas lineales invariantes en el tiempo: es aplicable tanto a sistemas lineales 
como no lineales, variantes e invariantes en el tiempo. En particular, el segundo método de Liapunov 
es indispensable para el análisis de estabilidad de sistemas no lineales en los que las soluciones 
exactas no son posibles. (Es importante señalar, sin embargo, que a pesar de que el segundo método 
de Liapunov es aplicable a cualquier sistema no lineal, los resultados no son una tarea fácil. Se 
necesita experiencia e imaginación para llevar a cabo el análisis de estabilidad en la mayoría de los 
sistemas no lineales.) 
El segundo método de Liapunov también se conoce como método directo de Liapunov. 


Segundo método de Liapunov. De la teoría de la mecánica clásica, se sabe que un sistema 
vibratorio es estable si su energía total se reduce continuamente, hasta alcanzar un estado de equilibrio. 

El segundo método de Liapunov se basa en una generalización de lo anterior: si el sistema 
tiene un estado de equilibrio asintóticamente estable, entonces la energía almacenada en él desplaza- 
da dentro del dominio de atracción se decrementa al aumentar el tiempo, hasta que por último adopta 
su valor mínimo en el estado de equilibrio. Sin embargo, para sistemas puramente matemáticos, no 
existe una forma simple de definir una “función de energía”. Para vencer esta dificultad, Liapunoy 
introdujo la función de Liapunov, una función ficticia de energía. Esta idea es más general y más 
utilizada que la de la energía. De hecho, cualquier función escalar que satisfaga las hipótesis de los 
teoremas de estabilidad de Liapunov (vea los teoremas 5-1 hasta 5-6) puede servir como función de 
Liapunov. 

Antes de que se analice más profundamente la función de Liapunov, es necesario explicar la 
definición positiva de las funciones escalares. 


Definición positiva de funciones escalares. Se dice que una función escalar V(x) es defini- 
da positiva en una región Q (que incluye el origen del espacio de estado) si V(x) > 0 para todos los 
estados x no cero de la región Q y si V(0) = 0. 

Se dice que una función variante en el tiempo K(x, £) es definida positiva en una región Q (que 
incluye el origen del espacio de estado) si está limitada por debajo por una función definida positiva 
invariante en el tiempo, es decir, si existe una función definida positiva V(x) tal que 


V(x, t) > Kx), para toda ¢ > tọ 


(0, 1) > 0, para toda 1 > f 


Definición negativa de funciones escalares. Una función escalar V(x) es definida negativa 
si -V(x) es definida positiva. 


Semidefinición positiva de funciones escalares. Una función escalar V(x) es semidefinida 
Positiva si es positiva en todos los estados en la región (2 excepto en el origen y en determinados 
estados donde es cero. 


Semidefinición negativa de funciones escalares. Una función escalar V(x) es semidefinida 
negativa si —-V(x) es positiva semidefinida. 


Indefinición de funciones escalares. Una función escalar V(x) es indefinida si en la región 


Q adopta tanto valores positivos como negativos, independientemente de lo pequeña que sea la 
región Q. 
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pio 5-7 
=7 este ejemplo se dan varias funciones escalares y sus clasificaciones de acuerdo con las definiciones 


interiores. Aquí se supone que x es un vector de dos dimensiones. 


1. (x)= x} +x; definida positiva 





2. (x)= x? + a definida positiva 
+x 
3. Vx) = (1, +) semidefinida positiva 
4.100 =-x? - (x +x definida negativa 
5. V(x) = xp) + x? indefinida 


Funciones de Liapunov. La función de Liapunov, que es una función escalar, es una fun- 


3afinida positiva y es continua junto con sus primeras derivadas parciales (en relación con sus 

-ntos) en la región Q alrededor del origen y tiene una derivada con respecto al tiempo que, 
o se toma a lo largo de la trayectoria, es definida negativa (o semidefinida negativa). Las 
unes de Liapunov involucran a x,, Xz... , X, y, posiblemente, a £. Se expresan en la forma V(x,, 

. X, 1), o sólo mediante V(x, £). Si las funciones de Liapunov no incluyen a £ en forma explicita, 
evas se expresan mediante V(x, xXx», ...,x,), o bien, K(x). 

Dbserve que P(x, f) es de hecho la derivada de V(x, £) con respecto a £ a lo largo de una 
con del sistema. Por tanto, Vx £) < 0 implica que V(x, A se va decrementando en función de £. 
3_nción de Liapunov no es única para un sistema dado. (Por esta razón, el segundo método de 
now es una herramienta más poderosa que las consideraciones convencionales de energía, 
rve que para un sistema cuya energía E se reduce en promedio, pero no necesariamente es 

2 en cada instante, E no es una función de Liapunov.) 

Más adelante en esta sección se demostrará que en el segundo método de Liapunov el compor- 
ento del signo de V(x, £) y el de su derivada de tiempo V (x, À = dV(x, )/dt dan información 
= (a estabilidad de un estado en equilibrio sin tener la solución. 

Observe que la función definida positiva más sencilla es de forma cuadrática: 


n n 
V(x) = È È qijxix;, 11j=1,2,...,n 
i=1j=1 
¿eneral, las funciones de Liapunov pueden no ser de forma cuadrática simple. No obstante, en el 


Ze cualquier función de Liapunov, los términos de grado menor en Y deben ser pares. Esto se 
Ze ver como sigue. Si se definen 


Xi a X2 A Xn-1 A 
TX, TX, ...3 = Xn- 
Xn Xn Xn 





zeces en la vecindad del origen, sólo los términos de grado más bajo se harán dominantes y V(x) 
zede escribir como 


V(x) + xE Vh, La, E Ss 1) 


æ mantienen las £, fijas, V(X,, X,,.. 


. , Èn 1) será una cantidad fija. Para el caso de p impar, £? 
adoptar tanto valores positivos como negativos cerca del origen, lo que significa que V(x) no 
zerinida positiva. Por tanto, p deberá ser par. 


A continuación se dan las definiciones de sistema, estado de equilibrio, estabilidad, estabili- 
zsintótica e inestabilidad. 


= 
ne 
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Sistema. El sistema que se considera está definido como 













à = f (x,t) (5 


donde x es un vector de estado (un vector-n) y f(x, £) es un vector-n cuyos elementos son funci 
de Xy, X3, - - » , Xy Y de £. (Observe que como modelo se utiliza un sistema de tiempo continuo 
presentar los conceptos básicos sobre el análisis de estabilidad mediante el segundo método 
Liapunov. Posteriormente se extienden los resultados obtenidos al sistema en tiempo discreto.) 
supone que el sistema de la ecuación (5-82) tiene una solución única, que empieza en la condici 
inicial dada. La solución de la ecuación (5-82) se denota como q(t; Xo, to), donde x = x, en t= t 
es el tiempo observado, Por tanto, 


P(t; Xo, to) = Xo 
Estado de equilibrio. En el sistema de la ecuación (5-82), un estado x,, donde 


f(x. 1) =0, para toda £ (5 


se llama estado de equilibrio para el sistema. Si el sistema es lineal e invariante en el tiempo, esto 
si f(x, £) = Ax, entonces sólo existirá un estado de equilibrio si A es no singular, y un número infiná 
de estados de equilibrio si A es singular. En el caso de los sistemas no lineales, pueden existir uno 
más estados de equilibrio. Estos estados corresponden a las soluciones constantes del sistema (x = 
para toda f). La determinación de los estados de equilibrio no involucra la solución de la ecuaciá 
diferencial del sistema, ecuación (5-82), sino sólo la solución de la ecuación (5-83). 

Cualquier estado de equilibrio aislado (es decir aislado de otros) puede ser desplazado al 
gen de las coordenadas, o f(0, £) = 0, mediante traslación de coordenadas. En esta sección, única- 
mente se tratará el análisis de estabilidad de este tipo de estados. 


Estabilidad en el sentido de Liapunov. A continuación, una región esférica de radio v, alre- 
dedor de un estado de equilibrio x, se denotará como 
jx — xd S r 
donde ||x — x,|| se llama norma Euclidiana y se define como sigue: 
jx = xa = [1 — xe) + (x — XY tee + (Xn Xne) Y” 
Sea S(8) el conjunto formado por todos los puntos tales que 
xo = xel E 8 
y hagamos que S(€) sean todos los puntos tales que 
PCE Xos to) — xoll E 8, para todo £ 2 tọ. 


Se dice que un estado de equilibrio x, del sistema de la ecuación (5-82) es estable en el sentido de 
Liapunov si, para cada S(e) existe un S(8) tal que las trayectorias que se inicien en S(8) no salgan de 
S(e) al aumentar ten forma indefinida. El número real $ depende de e y, en general, también depende 
de fọ. Si 6 no depende de t, se dice que el estado de equilibrio es uniformemente estable. 

Lo que se ha enunciado aquí es que primero se escoge la región S(e) y, para cada S(€), deberá 
existir una región S(8) tal que trayectorias que se inicien dentro de S(8) no salgan de S(e) conforme 
t se incrementa en forma indefinida. 
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Estabilidad asintótica. Se dice que un estado de equilibrio x, del sistema de la ecuación 
¿2 es asintóticamente estable si es estable en el sentido de Liapunov y si cada solución que se 
mu <= desde el interior de S(S) converge, sin salir de S(€) hacia x, conforme t se incrementa en forma 
ic nida. 

En la práctica, la estabilidad asintótica es más importante que la simple estabilidad. Sin embar- 
zado que la estabilidad asintótica es un concepto local, el hecho de establecer la estabilidad 
Tio: ica no necesariamente significa que el sistema operará de manera correcta. Por lo general, es 
=sario algún conocimiento del tamaño de la región más grande de la estabilidad asintótica. Esta 
z7 se conoce como dominio de atracción. Es esa parte del espacio de estado en la cual se origi- 
as trayectorias asintóticamente estables. En otras palabras, cualquier trayectoria que se origine 
+. Jominio de atracción es asintóticamente estable. 


Estabilidad asintótica global. Si la estabilidad asintótica es válida para todos los estados 
2 todos los puntos en el espacio de estado) a partir de donde se originan todas las trayectorias, se 
fu: zue el estado de equilibrio es estable asintóticamente global. Esto es, el estado de equilibrio x, 
s:stema dado por la ecuación (5-82) se dice estable asintóticamente global si es estable y cada 
> 1Ón converge a x, conforme ¢ se incrementa en forma indefinida. Es claro que una condición 
z¿saria para la estabilidad asintótica global es que exista sólo un estado de equilibrio en la totali- 
Es: iel espacio de estado. 

En problemas de ingeniería de control, la estabilidad asintótica global es una característica 
es<z5le. Si el estado de equilibrio no es estable asintóticamente global, entonces el problema se 
or «corte en determinar la región más grande de estabilidad asintótica. Esto por lo regular es muy 
41... No obstante, para efectos prácticos, es suficiente con determinar una región de estabilidad 
eciotica lo suficientemente grande para que ninguna perturbación la exceda. 


Inestabilidad. Se dice que un estado de equilibrio x, es inestable si para algún número real 
€ > cualquier número real ô> 0, sin importar qué tan pequeño, siempre existirá un estado x, en 
S * tal que la trayectoria que se inicie en ese estado salga de S(e). 


Representación gráfica de estabilidad, estabilidad asintótica e inestabilidad. Una repre- 
se" =ción gráfica de las definiciones anteriores aclarará sus significados. 

Consideremos el caso de dos dimensiones. Las figuras 5-24), b) y c) muestran los estados de 
en. brio y las trayectorias tipicas que corresponden a estabilidad, estabilidad asintótica e inestabi- 


Ste) Ste) Sle) 


S(8) S(5) S15) 


NS O > 


(a) (b) (c) 


Figura 5-2 a) Estado de equilibrio estable y una trayectoria representativa; b) estado de equilibrio 
estable asintóticamente y una trayectoria representativa; c) estado de equilibrio inestable y una 
trayectoria representativa. 
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lidad en forma respectiva. En la figura 5-2a), b) o c), la región S(8) limita el estado inicial x.. y 
región S(€) corresponde a los límites de la trayectoria que se inicia de cualquier estado inicial x, 
la región S(8). 

Observe que las definiciones anteriores no especifican la región exacta de las condici 
iniciales permisibles. Por tanto, las definiciones sólo se aplican a la vecindad del estado de 
brio, a menos que S(e) corresponda a la totalidad del plano de estado. 

Observe que en la figura 5-2c) la trayectoria sale de S(€) y, por tanto, todo el estado de 
brio es inestable. No podemos, sin embargo, decir que la trayectoria se irá al infinito, ya que 
acercarse a un ciclo límite fuera de la región S(e). (Si un sistema lineal de tiempo invariante 
inestable, las trayectorias que se inician incluso cerca del estado de equilibrio inestable van al i 
to. Pero tratándose de sistemas no lineales, esto no es necesariamente cierto.) 

Es importante señalar que las definiciones aquí presentadas no son las únicas que definen 
conceptos de la estabilidad de un estado de equilibrio. De hecho, existen algunos libros con difi 
tes formas de definir la estabilidad. Por ejemplo, en la teoría de control convencional, sólo aq 
sistemas que son estables asintóticamente se denominan sistemas estables, y aquellos sistemas 
bles en el sentido de Liapunov, pero que no son estables asintóticamente, se llaman inestables. 
ejemplo es la estabilidad BIBO. Un sistema lineal de tiempo invariante se llama estable de en 
acotada y salida acotada (estable BIBO) si la salida que se inicia a partir de un estado inicial arbi 
rio queda acotada cuando la entrada también está acotada. Se debe notar, sin embargo, que en 
libro, cuando se utilice la palabra “estabilidad”, por lo general significará estabilidad asintótica en 
sentido de Liapunov. 


Teorema de Liapunov sobre la estabilidad asintótica. Se puede demostrar que si una 
ción escalar V(x), donde x es un vector n, es definida positiva, entonces los estados x que satis 


V(x) = C 


donde C es una constante positiva, están en una hipersuperficie cerrada en el espacio de estado de 
dimensiones, al menos en la vecindad del origen. Si V(x) => œ conforme ||x|| — o, entonces 
superficies cerradas se extienden sobre la totalidad del espacio de estado. La hipersuperficie K(x) 
C, está enteramente en el interior de la hipersuperficie V(x) = C, siempre que C, < C}. 

Para un sistema dado, si es posible encontrar una función escalar definida positiva K(x). 
que su derivada de tiempo tomada a lo largo de una trayectoria sea siempre negativa, ento 
conforme el tiempo aumenta, V(x) toma valores cada vez más pequeños de C. Conforme el tie: 
aumenta, V(x) finalmente se reduce a cero y, por tanto, x también se reduce a cero. Esto impli 
estabilidad asintótica del origen del espacio de estado. El teorema principal de estabilidad de Liap 
que es una generalización de lo anterior, proporciona una condición suficiente para la estabili 
asintótica. Este teorema puede enunciarse como sigue. 


Teorema 5-1. Suponga que un sistema está descrito por 
kx =f(x,1) 
donde 
f(0, £) =0, para todo £ 
Si existe una función escalar V(x, £) con derivadas parciales de primer orden continuas y que sati 


an las condiciones a 
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i (x, £) es definida positiva. 
2. F(x, t) es definida negativa. 


m-zces el estado de equilibrio en el origen es uniforme y asintóticamente estable. 
Si. además, V(x, 1) > =% conforme |Ix[| > æ, entonces el estado de equilibrio en el origen es 


¡7 Tme y asintóticamente estable global. (Para probar este teorema, vea el problema A-5-18.) 
Las condiciones de este teorema se pueden modificar como sigue: 


. t(x, £) es definida positiva. 
. > (x, £) es semidefinida negativa. 


Las 4 = 


P(t; Xo, to), £) no desaparece para / 2 tọ para cualquier f, y para cualquier x, + 0, donde 
di: Xo, fo) denota la solución que se inicia a partir de x, en 1= t}. 


mo" ces el origen de sistema es uniforme y asintóticamente estable global. 

-a equivalencia de la condición 2 del teorema y las condiciones modificadas 2” y 3' se pueden 
zomo sigue. Si Ÿ (x, A no es definida negativa sino sólo semidefinida negativa, entonces la 
w=ctoria del punto representativo se puede volver tangente a alguna superficie determinada V(x, £) 
I Dado que Y (Pf; Xa to), £) no desaparece para £ > f, para cualquier £, y para cualquier X, + 0, el 


representativo no puede permanecer en el punto tangente [el punto que corresponde a Y (x, £) 
" nor tanto debe moverse hacia el origen. 


Teorema de Liapunov sobre la estabilidad. Para probar la estabilidad (pero no la estabilidad 
=:ca) del origen del sistema definido por la ecuación (5-82) se puede aplicar el siguiente teo- 


Teorema 5-2. Suponga un sistema descrito por 
x= f(x,1) 


f:0. £) = 0 para toda £. Si existe una función escalar V(x, £) que tenga derivadas parciales de 
z orden continuas y que satisfaga las condiciones 


-x. 1) es definida positiva. 
+x. 1) es semidefinida negativa. 


us el estado de equilibrio en el origen es uniformemente estable. 

=berá notarse que la semidefinición negativa de Px, APAS alo largo de las trayec- 

ts significa que el origen es uniformemente estable pero no necesariamente uniforme y 
z camente estable. Por tanto, en este caso, el sistema puede mostrar una operación cíclica lí- 


Inestabilidad. Sì un estado de equilibrio x = 0 de un sistema es inestable, entonces existe una 


z escalar W(x, f) que determina la inestabilidad del estado de equilibrio. A continuación se 
será un teorema sobre la inestabilidad. 
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Teorema 5-3. Suponga que un sistema está descrito por 
x = f(x, 1) 


donde 
f(0,5=0, para todo f 2 £, 


Si existe una función escalar W(x, 1) que tenga primeras derivadas parciales continuas y que 
ga las condiciones 


1. W(x, 1) es definida positiva en alguna región alrededor del origen. 
2. W(x, 1) es definida positiva en la misma región. 


entonces el estado de equilibrio en el origen es inestable. 


Observaciones. Cuando se aplica el análisis de estabilidad de Liapunov a sistemas no li 
les es necesario hacer algunos comentarios. 


1. En la aplicación de los teoremas de estabilidad de Liapunov a un sistema no lineal, las 
ciones de estabilidad obtenidas a partir de una función de Liapunov determinada son co 
nes suficientes pero no son condiciones necesarias. 

2. Una función de Liapunov para un sistema determinado no es única. Por tanto, es im 
señalar que el no encontrar una función de Liapunov adecuada para mostrar estabili 
estabilidad asintótica o inestabilidad del estado de equilibrio bajo consideración, puede 
información sobre la estabilidad. 

3. Aunque una función de Liapunov determinada puede probar que el estado en equilibrio 
consideración es estable o estable asintóticamente en la región (2 donde incluye este es 
equilibrio, esto no necesariamente significa que los movimientos son inestables fuera 
región (). 

4. Para un estado de equilibrio estable o asintóticamente estable, siempre existe una funció 
Liapunov con las propiedades requeridas. 


Análisis de estabilidad de los sistemas lineales invariantes en el tiempo. Existen 
métodos para la investigación de la estabilidad asintótica de sistemas lineales invariantes en el 
po. Por ejemplo, para un sistema de tiempo continuo descrito por la ecuación 


Xx = Ax 


se puede decir que una condición necesaria y suficiente para la estabilidad asintótica del ori 
sistema es que todos los valores propios de A tengan partes reales negativas, o que los c 
polinomio característico 


IsI — A| = s" + as"! + -++ + an-s +4, 


tengan partes reales negativas. 
De igual manera, para un sistema en tiempo discreto representado por la ecuación 


x(k + 1) = Gx(k) 


una condición necesaria y suficiente que se puede enunciar para la estabilidad asintótica del 
es que todos los valores propios de G tengan magnitud menor que la unidad, o que los c 


polinomio característico ; 
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ZI-G|=2>+a27 +- + aniz +0, 


cer ren en el interior del círculo unitario centrado en el origen del plano z. 
== embargo, encontrar los valores propios puede ser difícil, en el caso de sistemas de orden 
z7 > cuando algunos de los coeficientes del polinomio característico no son numéricos. En 
05. puede aplicarse el criterio de estabilidad de Jury o los criterios de estabilidad de Routh— 
"z El método de Liapunov, que proporciona una alternativa al análisis de estabilidad de siste- 
jInczles invariantes en el tiempo, es algebraico y no requiere factorización del polinomio carac- 
c:>. como más adelante se verá. Es importante notar que para los sistemas lineales invariantes 
zempo, el segundo método de Liapunov no da sólo condiciones suficientes, sino también 
fc as necesarias y suficientes para la estabilidad o para la estabilidad asintótica. 
z el siguiente análisis de estabilidad de sistemas lineales invariantes en el tiempo, se supone 
& -~ valor propio A, de la matriz A es una cantidad compleja, entonces A debe contener a A,, que 
¿gado complejo de A,, como su valor propio. Entonces, cualesquiera valores propios com- 
23 A aparecerán como pares complejos conjugados. Asimismo, en las siguientes discusiones 
estabilidad, se utilizará la expresión de transpuesta conjugada, en lugar de la expresión de 
¿sia de la matriz A, ya que los elementos de la matriz A pueden incluir conjugados comple- 
Li tanspuesta conjugada de A se describe como A*. Es una conjugada de la transpuesta: 


- 


pu 


A* =A7 


1nálisis de estabilidad Liapunov de sistemas lineales en tiempo continuo e invariantes en el 
". Considere el siguiente sistema lineal invariante en el tiempo: 


kx = Ax (5-84) 


1 25 el vector de estado (un vector-n) y A es una matriz constante de 2 x n. Se supone que A 
7. zular. Entonces el único estado de equilibrio es el origen, x = 0. La estabilidad del estado de 


mcr. o del sistema lineal invariante en el tiempo se puede investigar fácilmente mediante el se- 
» metodo de Liapunov. 


žara el sistema definido por la ecuación (5-84), se escoge como posible función de Liapunov 
V(x) = x*Px 


P es una matriz hermítica definida positiva. (Si x es un vector real, entonces P se puede 


rar como una matriz simétrica real definida positiva.) La derivada en el tiempo de V(x) a lo 
że cualquier trayectoria es 


V(x) 


x*Px + x*Px 
(Ax)*Px + x*PAx 
x*A*Px + x*PAx 
x*(A*P + PA)x 


Il 


tl 


a 2 F(x) se escogió para ser definida positiva, se requiere, para la estabilidad asintótica, que 
xa definida negativa. Por tanto, se requiere que 


V(x) = —x*0Qx 
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donde 
Q =-(A"P + PA) = definida positiva 


Por tanto, para la estabilidad asintótica del sistema de la ecuación (5-84), es suficiente que Q 
definida positiva. 

Para probar que una matriz de n x n es definida positiva, se aplica el criterio de Sylvester, 
dice que una condición necesaria y suficiente para que una matriz sea definida positiva es que 
determinantes de todos los menores principales de la matriz sean positivos. Considere, por ejem 
la siguiente matriz hermítica P de n x n (si todos los elementos de P son reales, entonces la m 
hermítica se convierte en una matriz simétrica real): 


Pu Pu **: Pin 
P = Pr Pa dada Pa 
Pin Pon SS Pnn 


donde p,j, representa el complejo conjugado de p,. La matriz P es definida positiva si todos 
menores principales sucesivos son positivos, esto es, si 








Pu Pu ‘t Pin 

pari JEN Pejs, cp (PA RE A g 
PR Pa : : 
Pin Pon +++ Pm 


En vez de especificar primero una matriz definida positiva P y examinar si Q es defini 
positiva, es conveniente especificar una matriz definida positiva Q primero y a continuación ex 
nar si P calculada a partir de 

A*P + PA = -Q 


es definida positiva o no. Observe que el que P sea definida positiva es una condición necesaria 
suficiente. Se resumirá lo anterior en forma de teorema. 


Teorema 5-4. Considere el sistema descrito por 
Xx = Ax 

donde x es un vector de estado (un vector n) y A es una matriz no singular constante de n x n. U 

condición necesaria y suficiente para que el estado de equilibrio x = 0 sea asintóticamente es 

global es que, dada cualquier matriz Q hermítica definida positiva (o cualquier matriz simétrica real 

finida positiva), existe una matriz P hermítica definida positiva (o una matriz simétrica real definida 
sitiva) tal que 

A*P + PA= ~Q (5- 


La función escalar x"Px es una función de Liapunov para este sistema. [Observe que en el sist 
lineal considerado, si el estado de equilibrio (el origen) es asintóticamente estable, entonces 
asintóticamente estable global.] 


Comentarios. Al aplicar el teorema 5-4 al análisis de estabilidad de sistemas lineales 
tiempo continuo e invariantes en el tiempo, se pueden hacer algunos comentarios importantes. 
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ty 


th 


. Si P (x) =-XQx no se desaparece a lo largo de cualquier trayectoria, entonces Q se puede 


seleccionar para ser semidefinida positiva. 
Si Q se escoge como una matriz definida positiva arbitraria [o una matriz semidefinida positi- 
va arbitraria si V (x) no se desaparece a lo largo de cualquier trayectoria] y la ecuación matricial 


A*P + PA = -Q 


se resuelve para determinar P, entonces la definición positiva de P es una condición necesaria 
y suficiente para la estabilidad asintótica del estado de equilibrio x = 0. 

El resultado final no depende de la matriz Q determinada escogida, siempre y cuando Q sea 
definida positiva (o semidefinida positiva, según el caso). 

Para determinar los elementos de la matriz P, se igualan las matrices A”P + AP y —Q, elemento 
por elemento. Esto resulta en n(n + 1)/2 ecuaciones lineales para determinar los elementos Pij 
= p, de P. Si se identifican los valores propios de A como A,, Àz, ...., A,, cada uno es repetido 
varias veces en relación con su multiplicidad como una raíz de la ecuación característica, y si 
por cada suma de dos raices 


AA +0 


entonces los elementos de P están determinados en forma única. (Observe que para una matriz 
estable A la suma A, + A, es siempre diferente de cero.) 

Al determinar si existe o no una matriz P simétrica real definida positiva o hermítica definida 
positiva, es conveniente escoger Q = I, donde I es la matriz identidad. Entonces los elementos 
de P quedan determinados a partir de 


A*P + PA = -I 


y se prueba si la matriz P es definida positiva. 


Ejemplo 5-8 


Determine la estabilidad del estado de equilibrio del sistema siguiente: 


X: = —X1 — 2x: 


X2 Gae A NG Ax, 


El sistema sólo tiene un estado de equilibrio en el origen. Seleccionando Q =1 y sustituyendo I en 
la ecuación (5-85), se tiene 


AFP + PA = -I 


Si observamos que Á es una matriz real, P deberá ser una matriz simétrica real. Esta última ecuación se 
puede escribir como sigue: 


-1 1 Pu Pr Pu Pr -1 -2 2 y] o] dE 
E aja aafe A 1 —4 0 1 ( ) 


donde se observa que pı = p,, con lo que se hace la sustitución apropiada. Si la matriz P resulta ser 
definida positiva, entonces x”Px es una función de Liapunov y el origen es asintóticamente estable. 
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La ecuación (5-86) produce las siguientes tres ecuaciones: 
=2puú + 2p2 = -1 

—2pu — 5p + pz =Q 
—4prv z 8P22 = -i 


Al resolver para las p, se tiene 


Por tanto, 


De acuerdo con el criterio de Sylvester, esta matriz es definida positiva. Por tanto, se concluye que 
origen del sistema es asintóticamente estable global. 
Debe hacerse notar que una función de Liapunov para este sistema es 


V(x) = x*Px = [x al 3 HE 


60 


a 


= 4(23xÍ — 14x,x2 + 11x2) 


y VO está dado por 
Va) =--% 


Análisis de estabilidad de Liapunov de sistemas en tiempo discreto. A continuación 
extenderá el análisis de estabilidad de Liapunov a los sistemas en tiempo discreto. Como en el 
de los sistemas en tiempo continuo, la estabilidad asintótica es el concepto más importante en 
estabilidad de los estados de equilibrio de los sistemas en tiempo discreto. 

Ahora se presentará un teorema de estabilidad para sistemas lineales o no lineales de tie 
discreto e invariantes en el tiempo, basados en el segundo método de Liapunov. Hay que señalar 
en los sistemas de tiempo discreto, en vez de V (x), se utilizará la diferencia directa V(x(k + 1) 
V(x(KT)), es decir 


AV(x(kT)) = V(x(k + DT) — V(UKT)) (5 
Teorema 5-5. Considere el siguiente sistema en tiempo discreto 
x((k + 1)T) = f(x(kT)) ( 
donde 
x = vector-n 


f(x) = vector-n con la propiedad de que f(0) = 0 
T = período de muestreo 


Suponga que existe una función escalar V(x) continua en x tal que 


1. Y) >0 para x + 0. 
2. AV(x)<0 para x + 0, donde 


AV«KT)) = V(x(k E 17) — VET) = VEKT) — VEKT) 
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10)=0 
1x) > =x cuando |¡x]) > «. 


s el estado de equilibrio x = 0 es asintóticamente estable global, y V(x) es una función de 


a 
E 
UA 


p 


Ibserve que en este teorema la condición 2 se puede reemplazar por la condición 


. A(x) < 0 para toda x, y AV(x) no se desaparece para cualquier secuencia solución {x(kT)} 
que satisfaga la ecuación (5-88). 


-< que significa que no es necesario que AV(x) sea definida negativa si no se desaparece en cual- 
- cer secuencia solución de la ecuación de diferencias. 


Análisis de estabilidad de Liapunov de los sistemas lineales en tiempo discreto e invariantes 
en el tiempo. Considere el sistema en tiempo discreto descrito por 


x(k + 1) = Gx(k) (5-89) 


nde x es el vector de estado (vector-n) y G es una matriz no singular constante de n x n. El origen 
1 = 0 es el estado de equilibrio. Se investigará la estabilidad de este estado mediante el segundo 
—2:0d0 de Liapunoy. 

Se escoge como posible función de Liapunov 


V(x(k)) = x*(k)Px(k) 


iu=de P es un matriz hermítica definida positiva (o una matriz simétrica real definida positiva). 
=ronces 


AVEO) = V(x(k + 1)) - VA(O) 

= x*(k + 1)Px(k + 1) — x*(k)Px(k) 
[Gx(k)]*P[Gx(k)] — x*(k)Px(k) 
x*(k)G*PGx(k) — x*(k)Px(k) 
= x*(kX(G*PG — Pix(k) 


1i 


Tao que V(x(k)) se seleccionó para ser definida positiva, se requiere, para la estabilidad asintótica, 
ae AM(x(1)) sea definida negativa. Por tanto 


AV(x(k)) = —x*(k)Qx(k) 
3-de 
Q = 4G"PG - P) = definida positiva 
Ze ese modo, para la estabilidad asintótica del sistema en tiempo discreto de la ecuación (5-89), es 
=- “ciente que Q sea definida positiva. 

Como en el caso de sistemas lineales de tiempo continuo, es conveniente especificar primero 
ırz matriz Q hermítica definida positiva (o simétrica real definida positiva) y a continuación ver si 
¿ matriz P determinada por 

G*PG - P = -Q 
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es definida positiva o no. Observe que una P definida positiva es una condición necesaria y suficien- 
te. Se resumirá en un teorema lo que se ha enunciado aquí. 


Teorema 5-6. Considere el sistema en tiempo discreto 


x(k + 1) = Gx(k) 


donde x es el vector estado (vector-1) y G es una matriz no singular constante de n x n. Una condi 
ción necesaria y suficiente para que el estado de equilibrio x = 0 sea asintóticamente estable global 
es que, dada cualquier matriz Q hermítica definida positiva (o simétrica real definida positiva) existe 
una matriz P hermítica definida positiva (o simétrica real definida positiva) tal que 


GPG- P=-Q (5-90) 


La función escalar x"Px es una función de Liapunov para este sistema. | 
Si AV(x(k)) = -x"(19Qx(k) no se desaparece a lo largo de ninguna serie de soluciones, entonces | 
Q puede ser escogida como semidefinida positiva. 


Estabilidad de un sistema en tiempo discreto obtenido al discretizar un sistema en tiempo 
continuo. Siel sistema se describe en términos de ecuaciones en el espacio de estado, la estabili- 
dad asintótica de un estado de equilibrio de un sistema en tiempo discreto obtenido al discretizar un 
sistema en tiempo continuo, equivale a la del sistema en tiempo continuo original. 

Considere un sistema en tiempo continuo 


x= Ax 
y el sistema correspondiente en tiempo discreto 


x((k + 1)T) = Gx(kT) 
donde 
G=e" 


Si el sistema en tiempo continuo es asintóticamente estable, es decir, si todos los valores propios de 
la matriz A tienen partes reales negativas, entonces 


1IG"=> 0, cuando n — œ% 


y el sistema discretizado también es asintóticamente estable. Esto se debe a que, si las A, son los 
valores característicos de A, entonces las e*” son los valores propios de G. (Observe que |e*”|< 1 
si ÀT es negativa.) 

Se debe notar que si se discretiza un sistema en tiempo continuo con polos complejos, enton- 
ces en casos excepcionales puede ocurrir inestabilidad oculta, en función de la selección del período 
de muestreo 7. Es decir, en algunos casos donde el sistema en tiempo continuo no es asintóticamente 
estable, el sistema discretizado equivalente pudiera parecer estable asintóticamente, si se observan 
únicamente los valores de salida en los instantes de muestreo. Este fenómeno ocurre sólo para algu- 
nos valores del período de muestreo T. Si se varía el valor de T, entonces esta inestabilidad oculta 
aparece en forma de inestabilidad explícita. Vea el problema A-5-15. 


Contracción. Una norma de x denotada como ||x|| se puede pensar como una medida de la 
longitud del vector. Existen diferentes definiciones de norma. Cualquier norma, sin embargo, tiene 
las siguientes propiedades: 


www.FreeLibros.me 













cr is Análisis de estabilidad de Liapunov 


335 
ixi] = 0, 


ixi] > 0, 

[Ix + yl] < ixil + Iyl 

áxil = Ik] lx, 

ción f(x) es una contracción si f(0) = 0 y 


IfI < ixl 


z.zun conjunto de valores de x + 0 y alguna norma. 


parax=0 
parax*0 
para toda x y y 


para toda x y constante real k 


Para sistemas en tiempo discreto se puede utilizar una norma |jx|| como función de Liapunov. 
¿zere el siguiente sistema en tiempo discreto: 


x(k + 1) = f(x«(k)),  f(0)=0 (5-91) 


xv es un vector-» y f(x) es también un vector-1. Suponga que f(x) es una contracción para toda 


3 3na norma. Entonces el origen del sistema de la ecuación (5-91) es asintóticamente estable 
- > una de sus funciones de Liapunov es 


V(x) = jixli 
puede ver como sigue. Dado que V(x) = |ixl| es definida positiva y 
AV(x(k)) = V(E(x(k))) — V(x()) = Eœ) — ixl 
—-:da negativa, porque f(x) es una contracción para toda x, se encuentra que K(x) = ||x]| es una 


ur. de Liapunov y, según el teorema 5-5, el origen del sistema es asintóticamente estable global. 
z. problema A-5-20.) 


Ea 


= 


5-9 


- insidere el siguiente sistema: 


x(k+1)]_]| 0 1il x(k) 
x(k + 1) -0.5 -1 x(k) 
Zezermine la estabilidad del origen del sistema. 


Se escoje Q como Í. A continuación, con referencia a la ecuación (5-90), la ecuación de estabili- 
1 de Liapunov se convierte en 


0 ~0.5|| pu Pu 0 1_[Pu pel__ 1 0 (5-92) 
1 -1 Pu pai -0.5 -1 Pu Pa 0 1 
$. æ encuentra que la matriz P es definida positiva, entonces el origen x = 0 es asintóticamente estable 
¿chal 


De la ecuación (5-92) se obtienen las siguientes tres ecuaciones: 
0.25p2 — pu = -1 
0.5(—pu + pa) ~ p2 = 0 
Pu —2p2 = -1 


zz ias cuales se obtiene 


AR =g = 
pu = #, Pu=3 Pa 


ole 
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SE 


Al aplicar el criterio de Sylvester para probar la definición positiva de la matriz P, se encuentra que P 
definida positiva. Por tanto, el estado de equilibrio, el origen x = 0, es asintóticamente estable global. 
Observe que en vez de escoger Q como I se podría haber escogido Q como una matriz semidefina 


positiva, tal como 
_j0 0 
e-f 3] 


siempre y cuando A V(x) =-x"()Qx(k) no se desaparezca a lo largo de cualquier serie de soluciones. 
la matriz Q semidefinida positiva recién definida, se tiene 
AV(x) = -x(k) 


Para el sistema actual, x,(k) idénticamente cero implica que x,(4) es idénticamente cero. Por tanto, 31% 
no se desaparece a lo largo de cualquier serie de soluciones, excepto en el origen. Por tanto, se p 
escoger esta matriz Q semidefinida positiva para determinar la matriz P de la ecuación de estabilidad 
Liapunov. La ecuación de estabilidad de Liapunov, en este caso se convierte en 


0 —0.5 Pii Pr 0 1 E Pnu Pu PELE 0 0 
1 -1 Pr Pz -0.5 -1 Piru Pz 0 1 


Al resolver esta última ecuación, se obtiene 
304 
=|5 5 
s Li 


Al aplicar el criterio de Sylvester, se encuentra que P es definida positiva, por tanto se obtiene la 
conclusión que antes: el origen es asintóticamente estable global. 


En consecuencia, 


= 
a 


tatoo Wal) 
uf uao 


PROBLEMAS DE EJEMPLO Y SOLUCIONES 


(Método de programación directa) Considere el sistema en tiempo discreto definido por 
Y(2) _ boz” + bız" +- +b, 
U(z) 2+a127 +- +a, 

Muestre que una representación en el espacio de estado de este sistema puede estar dada por 


x(k +1) 0 1 0. > 0 || xak) 0 
x(k +1) 0 0 Lo > 0 || x(k) 0 
: =|:  ; : : Jef Je) 
Xn-(k + 1) 0 0 0 0 + 1 lx) 0 
Xn(k + 1) la Tr Tn +++ —a || x(k) | 1 
x(k) 
y(k) = [bn a an bo:bn-1 7 an-ı bo: pe :b, ~a bo] Tak) + byu(k) 


Xn (k) 
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Solución El sistema dado puede modificarse a la forma 
Y(z) _bo+biz*+ba2 +- + bz” 
U(z) l1+az’+az?+ e +a” 

(bı = ar bo)z ~’ + (b2 am; az bo)z +e + (bn ia an bo)jz ™” 
1+az2 +a2*+--+a,z2” 

Esta última ecuación se puede escribir como sigue: 

Y(2) = ba U(2) 
(bı — arbo)z"* + (bz ~ azbo)z™? + -+-+ + (bn — an bo)z™” 


= ba + 


5-95 
+ 1+a2 +02 *+>+-+anz ” Ut) $72 
Se define 
- (b, — ai bo)z™' + (ba — azbo)z™? + +++ + (bn — anbojz " 
= ” ->———_ —_—________—__—_——— A a a E - 6 
YG) l1+az taz? + e taz” u) (526) 
Entonces la ecuación (5-95) se convierte en 
Y(z) = boU(z) + Y(z) (5-97) 
Al rescribir la ecuación (5-96) a la forma siguiente: 
Y(z) 
(b; i a bo)z™' + (b2 m azbo)z p y (bn ae an bo)z ™” 
E U() - 
O l+az’ taz? +t taz" Q(z) 
De esta última se pueden obtener las dos ecuaciones siguientes: 
Q(z) = -aız™° Q(z) - az’ Q(z) — <+- — anz ™ Q(z) + U(z) (5-98) 
X 
F(z) = (bı — arbo)z"*Q(z) + (bz - arba)z ° Q(z) + --- 
+ (b, — an bo)z™ Q(z) (5-99) 
Ahora se definen las variables de estado como sigue: 
Xz) =z" Q(z) 
X(z) = z"*' Q(z) 
: (5-100) 


Xalz= z ° Q(z) 
Xn(2) = 2 *Q(2) 
Entonces, claramente se tiene 
2X (2) = Xz) 
2X (2) = Xx(2) 


2X (2) = Xa(z) 
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En términos de ecuaciones en diferencias, las n— 1 ecuaciones anteriores se convierten en 
x(k + 1) = x(k) 
x(k + 1) = x(k) (5-101 
Xak + 1) = xa(k) 
Al sustituir la ecuación (5-100) en la ecuación (5-98) se obtiene 
2Xn(2) = -41 Xa(2) — a2 Xn-1(z) — ::* — an Xı(z) + U(z) 
que puede ser transformada a una ecuación de diferencias: 
Xalk + 1) = -an xı(k) — an-1 x(k) — `+: — Axa (k) + u(k) (5-1024 
Asimismo, la ecuación (5-99) se puede rescribir como sigue: 
Ye) = (bı — a, bo)Xn (2) + (bo — az bo)Xn-1(2) + ++: + (bn — anboJX (2) 
Al usar esta última ecuación, la ecuación (5-97) puede ser escrita de la manera 
y(k) = (bn — an bo)xi(k) + (bn-1 — an-ı bo)x2(k) 
A (bi = 4i bo)xn(k) + bulk) (5-1033 
Si se combinan las ecuaciones (5-101) y (5-102) obtenemos como resultado la ecuación de estado dada 


por la ecuación (5-93). La ecuación de salida, ecuación (5-103), se puede volver a escribir en la forma 
dada por la ecuación (5-94). 


Problema A-5-2 
(Método de programación anidada) Considere el sistema con función de transferencia pulso definido par 


Y(z) _ bot biz +- + bz” 
UG) 1+4a2' +--+anz” 





G(z) = 


Muestre que la representación en el espacio de estado de este sistema puede estar dado como sigue: 


x(k +1) 0.0 0 0 -a, || x(k) 
x(k +1) 1 0 0 0 —An-1 x(k) 
Xn-i(k + 1) 0 0 -10 4 Xn-1(k) 
Xn(k + 1) 0 0 0 1 -a Xalk) 
bn — an bo 
bn-1 7 än-1 bo 
+ : u(k) (5-1 
b, — azbo 
bı — a, bo 
x(k) 
x(k) 
y()=[0 0 =- 0 1) :  |+bu(k) ; 6-1 
Xn-(k) 
Xn(k) 
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Solución Vuelva a escribir la función de transferencia pulso como sigue: 


Y(z) — bo U(z) + za, Y(z) — bı U(z)] 


+ 2 la, Y(z) — b: U(z)] + --- + zlar Y(z) — bn U(z)] = 0 
o bien 


Y(z) = boU(z) + z™!(b, U(z) — a, Y(2) + z'(b,U(z) — a Y(2) 
+ 2"[byU(z) — asY(2) + ---}}) (5-106) 
Ahora se definen las variables de estado de la siguiente manera: 
Xa(z) = 2"'[b, U(z) — ai Y(z) + X„-1(z)] 
Xn-1(z) = z` [b,U(z) — a Y(z) + X,-42)] 


(5-107) 
X(z) = z`'[b„n-1 U(z) — a„-1-Y(z) + X(2)] 
X (2) = z™'[b„, U(z) — a, Y(z)] 
Entonces la ecuación (5-106) se puede escribir en la forma 
Y(z) = boU(z) + X.(2) (5-108) 
Al sustituir la ecuación (5-108) en la ecuación (5-107) y multiplicar ambos lados de las ecuaciones por z, 


se obtiene 
ZXn(2) = Xa-1(2) — aı Xa(z) + (bı — arboJU(z) 
2Xn-1(2) = Xa-2A2) — a2 X, (z} + (b2 — a2boJU(z) 


zXAz) = Xi (2) — an-ı Xn (Z) + (bn-1 — an-ı boU (2) 
zX (2) = -a, Xa(2) + (bn — arboJU(z) 


Al tomar las transformadas inversa z de las n ecuaciones anteriores y al escribir las ecuaciones resultantes 
2n orden inverso, se obtiene 


xi(k + 1) = —anx tk) + (bn — anbojuík) 
XAk + 1) = x(k) — On-1xn(k) + (bn-1 — an-ı boJu(k) 


Xnailk + 1) = xn-2(k) — a2xn(k) + (bı — azbojJu(k) 
Xn(k + 1) = xn-1(k) — arxn(k) + (b; — ar boju(k) 
También, la transformada inversa z de la ecuación (5-108) da 
y(k) = x(k) + bou(k) 


4. volver a escribir la ecuación de estado y la ecuación de salida en la forma estándar matricial, obtene- 
Tos las ecuaciones (5-104) y (5-105), respectivamente. 


ciema A-5-3 


Método de programación de expansión en fracciones parciales) Considere el sistema con función de 
ransferencia pulso dado por 
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Y(z) = boz” + bız”! +o bn 
U(z) z*+az! +. +a, 





Demuestre que la ecuación de estado y la ecuación de salida se pueden dar en la forma canónica diagor.al 
siguiente, si todos los polos son distintos. 


x(k +1) p 0 > 0 xk) 1 
ON E pe o Ojak) iuc) (65-1 
xa(k + 1) 0 0 e D xalk) 1 
y 
x(k) 
y(k) = [c CG e cn] xk) + boulk) (5-114 
Xn(k) 


Solución La función de transferencia pulso del sistema se puede modificar como sigue: 
Y(z) _ boz” + biz" +-:- +0, 
U(z) z" +az" + +a 
(bı — asbojyz""* + (bz — azbo)z™™? + +> + (b, — an bo) 
(z — pi)\(z — p2): (2 — Pa) 
En vista de que todos los polos de la función de transferencia pulso Y(z)/U(z) son distintos, Y(2/U1= 
puede expandir a la forma siguiente: 





= bo + (5-111 











Y(z) Ci Ca € e 
= bo + + +o +Z (5-1 
U(z) j z=p z=p Z 7 Pn 
donde 
Lats |Y) 
Ci = im [xa (z p] 


La ecuación (5-112) se puede escribir en la forma 




















Ci C2 Ca EA 
= + +e U (5-11 
Y(2) = bo U(z) + me U(z) ST U(z) Be (z) 
Las variables de estado se definen como sigue: 
Xı(2) = z- p U(z) 
MIA E U(z) (5-17 
X, de U(2z) 
e 


La ecuación (5-114) se puede volver a escribir como 
zX (2) = pı X (2) + U(z) 


2XAz) = po XAz) + U(z) 


www rdl Brose) + UE) 
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Asimismo la ecuación (5-113) se puede escribir como 
Y(2) = boU(2) + ci X (2) + ca XaAz) + + cn Xan (2) (5-116) 
Las transformadas inversas z de las ecuaciones (5-115) y (5-116) se convierten en 
x(k +1) = pixuík) + u(k) 
k +1) = + 
xl ) = paxdk) + u(k) (5-117) 
Xa(k + 1) = paxn(k) + u(k) 


Y(K) = cixi(k) + cx Ak) + +00 + coxn(k) + boulk) (5-118) 


Al volver a escribir la ecuación de estado y la ecuación de salida en forma de ecuaciones matriciales. se 
obtienen las ecuaciones (5-109) y (5-110). 


Problema A-5-4 
(Método de programación de expansión en fracciones parciales) Considere el sistema con función de 
transferencia pulso definido por 


Y(2) _ boz” + biz" ' +: +0, 
U() Y+az" + ta 
Suponga que el sistema incluye varios polos del orden m en z = p, y que todos los demás polos son 
distintos. 
Demuestre que este sistema puede representarse por la siguiente ecuación de estado y por la 
siguiente ecuación de salida: 











x(k +1) p10. 0; 0 >- 01 fx(k) 0 
xk +1) 0p 1 01 O >- 04 | xk) 0 
. » . . .) a . . . 
Si: : : 
mkk +1 0.0.0 0 0 m(k 1 
a E Rd AE O ia Liaty (5-119) 
Xm+i(k + 1) 000.. 0 l Ps 0| xr +1(4) 1 
; poty 24 i 
: Ao A B E 
xn(k +1) 0.0 0--- 0; 0 Pa) |xn(k) 1 
xk) 
y(k) En [cr CEPAS Cn) x(k) + bou(k) (5-120) 
xn(k) 
Solución Dado que la función de transferencia pulso del sistema se puede escribir en la forma 
Y(z) _ boz” + biz"! 4 +++ + ba 12 +b, 
U(z) (2 = p)”(z — PM — Pm+2) +++ (2 — Pn) 
(b; = 4 bo)z”™™' + (b2 == azbyjz" 7? EPA (bn ~ün bo) 
R bo + A A A A A O E IO a 
(2 = py" = Pmi) t (2 — Pa) 
cı C2 Cm 
= bo + KE -nt 
e (z= p)” (z= py z= p 
Cm+1 Cm+2 Ca (5-121) 
Y Ll H O + 
2 — Pmr+i Z 7 Pm+2 z — Phn 
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se obtiene 
Y) = bo UG) +50 y U(z) ero y ¡U(z)++- 
di Cm+1 U(z) to Cm+2 Ulz) +... + (5-122, 
2 Pm+1 — Pm+2 


Las primeras m variables de estado X,(2), (2), ..., 


Xi, (z) se definen mediante las ecuaciones 


1 
X (2) = (z -= piy” U(z) 
1 
Xa(2) = Ga (5-123, 


( 


Xa(2) == 66) 





y las n— m variables de estado restantes X,,.. (2), Xn 12), ..., X,(z) se definen mediante las ecuaciones 
1 
Xml) = a U(z) 
Xm+(z) = PO a a (5-124) 
X, (z) = : U(z) 
n z=- Ph 


Observe que las m variables de estado definidas por la ecuación (5-123) están relacionadas una con la 


otra, mediante las ecuaciones siguientes: 


Xı(z) _ 
XG) 
XAz) _ 

Er 





X3(z) 


Xm-1(2) E 


Xm(2) 


1 


2 Pi 


1 





(5-125) 


EL 
z Pi 


Al tomar las transformadas inversas z de toda la ecuación (5-125), la última ecuación de la ecuación (5- 


123) y toda la ecuación (5-124), se obtiene 


xi(k + 1) = 


prulk) + x(k) 


x(k + 1) = pixak) + x(k} 


(5-126) 


ml + 1) = PiXm-i(k) + xm(k) 
Xmlk + 1) = pixmtk) + u(k) 
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Am k +1) = Pms1Xm+1(k) + u(k) 


Xna(k + 1) = prxn(k) + u(k) 
La ecuación de salida dada por la ecuación (5-122) se puede volver a escribir como sigue: 


Y(2) = C1X (2) + 0 XAz2) + ++ + Cm Xm(2) + Cri Xan z) 
+ Cmr2 A m+AZ) +0 + Cr Xn(z) + boU(z) 
Al tomar la transformada inversa z de esta última ecuación, se obtiene 
y(k) = cx [k) + Cox Ak) + ++ + CmXm[k) + Coros Amar k) 

+ Cmr2Xme2[k) + +0 + Caxa(k) + boulk) (5-127) 
Al volver a escribir las ecuaciones (5-126) y (5-127) en la forma estándar matricial, se obtienen las 
ecuaciones (5-119) y (5-120), respectivamente. 

Problema A-5-5 


Utilizando el método de programación anidada (refiérase al problema A-5-2), obtenga la ecuación de 
estado y la ecuación de salida para el sistema definido por 


Y(z)__ 2 +52”? 
U(Z) 1+42 +32? 
A continuación dibuje un diagrama de bloque para el sistema, que muestre todas las variables de estado. 





Solución La función de transferencia pulso dada se puede escribir en la forma 
Y(z) = 3 UU(2) - 4Y (z) + 2 (SU(2) — 3Y(2)) 

Defina 

X (2) = 2 U(2) — 4Y (2) + Xz) 

XAz) = z [SU(z) — 3Y(2)] 

Y(z) = X(2) 
Entonces se obtiene 

2X (2) = -4X (2) + X22) + U(2) 

zXAz) = -3X (2) + 5U(2) 


La ecuación de estado puede por tanto estar dada por 


x(k + D|_]-4 1 x(k) 1 
p + A A E TEA $ [Judo 
y la ecuación de salida se convierte en 
O a] 


La figura 5-3 muestra el diagrama de bloques para el sistema definido por las ecuaciones en el espacio de 
estado. La salida de cada elemento de retraso constituye una variable de estado. 


Prrolema A-5-6 
Obtenga una representación en el espacio de estado del sistema mostrado en la figura 5-4. El período de 
muestreo T es de 1 segundo. 
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u{k) 





Figura 5-4 Diagrama de bloques del sistema de control del problema A-5-6. 


Solución Primero se obtendrá la transformada z de la función de transferencia de la trayectoria dir 


A O E o PRE 
0)=2| Ss |. í | 
_ 0.3679(z + 0.7181) 
~ (z — 1)(z — 0.3679) 


Luego se puede obtener fácilmente la función de transferencia pulso en lazo cerrado. Existen mu 
formas para obtener Ía representación en el espacio de estado para un sistema como éste, tal y coma 
analizó en la sección 5-2. En este problema se mostrará otro método, basado en la modificacior 
diagrama de bloques. 
G(z) se expande en fracciones parciales: 
1 0.6321. 2” 0.6321z ' 
-1 2-0.3679 1-z' 1-0.36797*' 


La figura 5-5 muestra el diagrama de bloques para el sistema. Se escoje la salida del elemento de rer 
unitario como una variable de estado, como se muestra en la figura 5-5. Entonces se obtiene 
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Figura 5-5 Diagrama de bloques modificado para el sistema mostrado en la figura 5-4, 


2X (2) = X (2) — [Xi(2) — 0.6321X2(2)] + U(2) 
zX Az) = 0.3679X (2) — [X (2) — 0.6321X2(2)] + U(z) 
Y(z) = X(z) — 0.6321X4z) 


de las cuales se obtiene 
x(k + 1) = 0.6321x,(k) + u(k) 
x(k + 1) = xk) + x(k) + u(k) 
y (k) = x(k} — 0.6321x(k) 


es decir 
x(k+1)|_| 0 0.6321 || x(k) 1 
as + 1 E 1 ÉS Ea 
k) 
k)=[1 -0.6321 *{ 
y(k) =[ e 
P—blema A-5-7 

Obtenga la representación en el espacio de estado del siguiente sistema con función de transferencia 
pulso: 


t (C E- 
U(z) (+1 +2) 


U'se el método de programación de expansión en fracciones parciales. También obtenga los valores 
iniciales de las variables de estado en términos de y(0), (1) y yQ). A continuación dibuje un diagrama de 
bloques para el sistema. 


Solución Ya que se necesitan los valores iniciales de las variables de estado en términos de v(0), v(1) y 
12), se modificará ligeramente el método de programación de expansión en fracciones parciales presen- 
zado en la sección 5-2. Se expanden YM(=Y/U(e). zY(/U() y Y/U) en fracciones parciales como 
sigue: 
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Y)2_3_2__3 3 
U(z) G+1? 241 2+2 


2Y(2)___5 10 __10 
U(z) +10? z+1 2+2 


Y) 5. 1 ¿A 
Ulz) (+1? z+1 2+2 


Y(2) l1 

U(z) (z +1) 

zY(z) | _ s > 1 

U(z) - 3 de 19 z+1 
1 


z?’ Y(z) 
A =- 20 
UC) 5 15 2+2 
Ahora se definen las variables de estado mediante la ecuación siguiente: 


Xı(z) 1 
U(z) C+) 


X2(2) o 1 (5-1 
U(z) z+1 


Xx) 1 
U(z) z+2 


Así, las variables de estado X(z), X(z) y Xy(z) están relacionadas con Y(2), zY(z) y 2?Y(2) como sigue: 

















Entonces se tiene 


3 =5 




















Y(z) HS Si] XL (z) 
zY(z2) |=|-5 10 -10|| Xx) (5-13 
z?’ Y(z) 5 -15 20|| Xx(z) 


De la ecuación (5-128) se obtiene 
(z + 1X, (2) = U(z) 
(z + D)X2z) = U(z) 
(z + 2)Xx3(2) = U(z) 
Si observamos que 
(z + 1)X (2) = X2(2) 
se obtiene 
zXı(z) = -X1(2) + X2Az) 
zX4Az) = —Xaz) + U(z) 
zX:(z) = -2X4(2) + U(z) 
La salida Y(z) está dada por la ecuación 


Y(z) = 5X (2) - 5X4z) + 5X3(2) 
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En consecuencia, se tienen las ecuaciones en el espacio de estado como sigue: 
x(k +1) = —x1(k) + x(k) 
x(k + 1) = —x2(k) + u(k) 
x(k + 1) = —2x[k) + u(k) 
y(k) = 5x(k) — Sxa(k) + Sxx(k) 


deci 
aeii a(k +1) f- 1 faw] To 
x(k +1)ļ=| 0 —1 OJ xx{k)|+]ļ1lu(k) 
x(k + 1) 0 0 -—2]|| x(k) 1 
x(k) 
y(k)=[S -5 5]| x(k) 
x(k) 

Los datos iniciales se obtienen mediante el uso de la ecuación (5-129), como sigue 
x1(0) 5 -5 5y 
x(0)|=]|/-5 10 -10 ya) 
x3(0) 5 -15 20 yQ) 

3 3 0 y) 
=13 3 3 y0) 
33 3[y0) 


El diagrama de bloques para este sistema se muestra en la figura 5-6. 


Problema A-5-8 
Obtenga una representación en el espacio de estado del siguiente sistema con función de transferencia 
pulso, tal que la matriz de estado sea diagonal: 
Y(z)_ 2+82+172 +8 
U(2) (+ 1DG+2G +3) 


Y a continuación obtenga el estado inicial x(0) en términos de y(0), (1), v(2) y u(0), (1) u(2). 


Solución Primero se dividen los numeradores de los lados derechos de Y-/U(=). zY(2y U(E) y 2? YEV 


Lz) entre los denominadores respectivos y se expanden los términos restantes en fracciones parciales, 
como sigue: 





Figura 5-6 Diagrama de bloques para el sistema considerado en el problema A-5-7. 
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Y(z) _ 1 y 2 77 1 
U(z) z+1 2+2 272+3 
zY(z) _ 1 4 3 
AA z+2 2+3 
z’ Y(z) 4 1 8 9 
Un  * A e a 
Rescribiendo, se tiene 
Y(2)-=U()__ 1 x 2 a 1 
U(z) 2+1 242 z+3 
2Y(2) - zU(z) — 2U(2) 1.2... 4- 3 
U(z) = z+1 242 2+3 
z?’ Y(z) — 2?U(z) - 22U(2) + 6U(2)_ 1 LE y 
U(z) z+1 242 2+3 
es decir 
Y(z) - U(z) _ 1 
UG) 1. 2. 1 A 
zY(z) — zU(z) — 2U(2) E iio a 1 
U(2) z2+2 
7 Y(z) — z? U(z) — 2zU(z) + 6U(z) EE 1 
U(z) z+3 
Las variables de estado X (2), Xy(z) y Xy(z) se definen de la siguiente manera: 
Xi (2) 1 
U(z) z+1 
X2(2) = 1 (5-1 
u(z) 72 
X3(z) 1 
U(z) 2 +3 
Entonces se tiene 
Y(2) — U(z) -1 2 1 1X() 
zY(z) — zU(z) — 2U(2) =] 1 -4 -3|| X2(2) (5-13 
2? Y(z) — z? U(z) — 2zU(z) + 6U(z) -1 8  9|| X%(z) 


Observe que la ecuación (5-130) se puede escribir en la forma 
zXı(z) = -X (2) + U(z) 
zX2z) = -2X Az) + U(z) 


zX3(2) = -3X3(z) + U(2) 
de la que se obtiene 
x(k + 1) = —x1(k) + u(k) 


x(k + 1) = —2xk) + u(k) 
xa(k + 1) = -3x;(k) + u(k) 
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La salida M(=) está dada por 
Y(2) = -X1G) + 2X2(2) + Xi(z) + U(2z) 


es decir 


y(k) = —x(k) + 2x:(k) + x(k) + u(k) 


En notación matricial, las ecuaciones en el espacio de estado se convierten en 


x(k + 1) -1 0 Off x(k) 1 
x(k +1)|= 0 -2 0 || x(k) | +] 1ju(k) 
x(k + 1) 0 0 =3 || x(k) 1 
x(k) 
y(k)=[~1 2 1]| x(k) | + u(k) 
x(k) 
Los datos iniciales se obtienen a partir de la ecuación (5-131) como sigue: 
x(O) f-1 2 1f' y(0) — u(0) 
x0) j =| 1 -4 -3 y(1) — u(1) — 2u(0) 
xa(0) -1 8 9] | y(Q)-u()- 2u(1) + 6u(0) 
-3 -3 23 y(0) — u(0) 
=| -} -2 -i y() — u(1) — 2u (0) 
13 ¿ly0)-u()-2u(1) + 6u(0) 


La figura 5-7 muestra el diagrama de bloques para el sistema presente. 





Figura 5-7 Diagrama de bloques para el sistema considerado en el problema A-5-8. 
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Problema A-5-9 
Sea A una matriz de n x n y sea su ecuación característica 


[AI — A| = A” + a + +48, 14+a,=0 
Demuestre que la matriz A satisface su ecuación característica, o que 
A+ a A t ¿+ 1A+0,1=0 


(Éste es el teorema Cayley—Hamilton.) 


Solución Primero se observa que adj(AI[ — A) es un polinomio en A de grado n— 1. Esto es 
adj (AI — A) = B A”! + B22"? ++ +B, 14 +B, 
donde 
B, =1 
Observe también que 
(àI — A) adj (AI — A) = [adj (AI — AJJAI — A) = |AI — AJI 
Por tanto, se obtiene 
JAI - AJI = A” + a IA" +e + anI + a, 1 
= (AI — AMB! + B2417? + --- + B,- A + B,,) 
= (B A”) + BA”? + -+ + Bni A + B,J(A1 — A) 


De esta ecuación se ve que A y B(i= 1, 2, .. . , n) conmutan. Por tanto, el producto de (ÀI — A) por adj(AH 
— A) se convierte en cero si cualquiera de éstos es cero. Si A se escribe en lugar de A en esta última 
ecuación, entonces claramente AI — A se convierte en cero. Por tanto, 


A” + a A”! 4 +, ¡A+a,1=0 


Lo que prueba el teorema Cayley—Hamilton. 


Problema A-5-10 
En referencia al problema A-5-9, se ha demostrado que cada matriz A de n x n satisface su propia 
ecuación característica. No obstante, la ecuación característica no es la ecuación escalar de grado mínimo 
que A puede satisfacer. El polinomio de grado mínimo que tiene A como raíz se conoce como polinomio 
mínimo. Es decir, el polinomio mínimo de una matriz A de n x n se define como el polinomio (À) de 
grado mínimo: 


PA) = A” + aq AT 4 ++ + Am-1A + Gm, m<=n 
tal que d(A) =0, es decir 
HA) = A” + a, A77! + Drk + am ¡A + am1=0 


El polinomio mínimo juega un papel importante en el cálculo de los polinomios de una matriz de n x n. 

Supongamos que d(A), un polinomio en A, es el máximo común divisor de todos los elementos de 
adj(AI — A). Demuestre que si el coeficiente del término de mayor grado en A de d(A) se escoge como 1 
entonces el polinomio mínimo (à) está dado por 


JAI — Al 
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Solución Por la suposición, el máximo común de la matriz adj(A1 ~ A) es d(A). Por tanto 
adj (ÀI — A) = d(A)B(A) 


zonde el máximo común divisor de los n? elementos (que son funciones de A) de B(A) es la unidad. En 


-ista de que 
(AI — A) adj (AI — A) = JAI — AJI 
¿2 obtiene 
d(AYAIL — A)B(à) = |AI — AJI (5-132) 
z2 lo cual se encuentra que JAF — Af es divisible entre d(A). Si 
(5-133) 


JAI — A| = d(AJU(A) 


zmonces el coeficiente del término de mayor grado en A de (A) es la unidad. De las ecuaciones (5-132) 


. 5.133) se tiene 
(AI — AJB(A) = y(A)1 


For tanto. 
Y(A) =0 


ITserve que (A) se puede escribir como sigue 
YA) = gA) + alà) 

iade a(A) es de menor grado que (à). Dado que (A) =0 y Hd(A) = 0, se debe tener que e(A) = 0. Dado 

<- AA) es el polinomio mínimo, (A) debe ser idénticamente cero, es decir 


YA) = 8AA) 


- serve que, debido a que H(A) = 0, se puede escribir 
AJI = (AL — AJC(A) 


= 57 tanto, 
YAOI = g(a) = g(A)(AI — AJC(A) 
< se obtiene 
B(A) = g(4)C(A) 
adserve que el máximo común divisor de los n? elementos de B(A) es la unidad. Por tanto 
gA) = 1 
Te aquí que, 
WA) = (A) 
z7tonces, de esta última ecuación y de la ecuación (5-133), se obtiene 
àI- A 
A 


Hay que señalar que el polinomio mínimo (A) de una matriz A de n x n se puede determinar por 


z procedimiento siguiente: 
1. Forme la adi(Al— A) y escriba los elementos de la adj(A1— A) como polinomios factorizados en A. 
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2. Determine d(A) como el máximo común divisor de todos los elementos de adj(AI— A). Selecci 
el coeficiente del término de mayor grado en A de d(A) como 1. Si no existe divisor comă 
da) =1. 

3. El polinomio mínimo d(A) entonces está dado como JAI — AJ dividido entre d(A). 


Si una matriz A de n x n tiene n valores propios distintos, entonces el polinomio mínimo de A es idérra 
al polinomio característico. Asimismo, si los diversos valores propios de A están enlazados en una 
na de Jordan, el polinomio mínimo y el polinomio característico son idénticos. Si, sin embargo. à 
diversos valores propios de A no están enlazados en una cadena de Jordan, el polinomio mínimo s 
grado menor que el polinomio característico. 

Utilizando como ejemplo las matrices A y B que siguen, verifique los enunciados anteriores 
relación con el polinomio mínimo, cuando se relacionan varios valores propios. 


214 2 0 0 
A=|0 2 0f, B=|0 2 0 
0 3 1 0 3 1 
Solución Primero considere la matriz A. El polinomio característico está dado por 
à-2 -1 -4 
MI=A]=| 0 1-2 0 |=(A-2:H—A-1) 
0 -3 4-1 


Así, los valores propios de A son 2, 2 y 1. Se puede demostrar que la forma canónica Jordan de A es 


DO 


1 0 
2 0 
0 1 


y los valores propios múltiples están enlazados en la cadena Jordan como se muestra. (Para obtener 
forma canónica Jordan de A, refiérase al apéndice A.) 
Para determinar el polinomio mínimo, primero se obtiene adj(A1 — A). Este está dado por 


A-2MA-1) (A+ID 4-2) 
adj (AI — A) = 0 a-a- 0 
0 1-2 (1-2) 


Observe que no existe un divisor común de todos los elementos de adj(AI — A). Por tanto, d(A) = 
Entonces, el polinomio mínimo (A) es idéntico al polinomio característico, es decir 


H(A) = [AL — A] = (A — Y%( — 1) 
=A- 5A +8 - 4 
Un cálculo sencillo prueba que 


A? -5SA*+8A-41=0 


pero 


A -3A+21+0 


Por tanto, se ha demostrado que el polinomio mínimo y el polinomio característico de esta matriz A 
los mismos. 
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A continuación. considere la matriz B. El polinomio característico está dado por 


A-=2 0 0 
AI- B=) 0 2-2 0 |=(A-2:-MA-1) 
0 -3 A-1 


¿n cálculo simple revela que la matriz B tiene tres vectores propios, y que la forma canónica Jordan de 
B está dada por 


Oo 
O wo 


0 
0 
1 


Por tanto, los valores propios múltiples no están enlazados. Para obtener el polinomio minimo, primero 
+2 calcula adj(Al — B): 


(A — 2 — 1) 0 0 
adj (AI — B) = 0 (A — 214 — 1) 0 
0 3(A — 2) (A — 27 
¿e lo cual es evidente que 
d(A) =14 - 2 


>ar tanto, 
PIB a-a- 
doia AA) A-=2 y 
= ara verificar, se calcula d(B): 


A —-31+2 


4 0 0 200 100 0.0.0 
(B) = B”-3B+2I1=|0 4 0|-310 2 0|+2|0 1 O|=|0 0 0 
0 9 1 0 3 1 0 0 1 00 0 


+ ¿ra la matriz dada B, el grado del polinomio mínimo es menor en | que el del polinomio característico. 
- m0 se muestra aquí, si los valores propios múltiples de una matriz de n x n no están enlazados en una 
.¿3ena de Jordan, el polinomio mínimo es de grado menor que el polinomio característico. 


arema A-5-12 


- ="nuestre que mediante el uso del polinomio mínimo la inversa de una matriz no singular A se puede 
+ cesar como un polinomio A con coeficientes escalares, como sigue: 


1 
ACU=-—(A" + aq A”? +- + ad 2A + amil) (5-134) 
Am 
a e a, son los coeficientes del polinomio mínimo 
PAJ = A” + a AT! + + m1 A tam 


. 220. obtenga la inversa de la matriz A siguiente: 


1.2.0 
A=/3 -1 -2 
1 0 -3 


Solución El polinomio mínimo H(A) de una matriz no singular A, se puede escribir como sigue: 
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H(A) = A” + a, A”! + +++ Am ¡A + amI=0 
donde a„ + 0. Por tanto, 
j= -= (A” + a A”! + + am-2Å° + am-1 A) 
Premultiplicando por A”!, se obtiene 
A` = -San +a, A”? +e + amA + amil) 


que es la ecuación (5-134). 
Para una matriz dada A, se puede dar adj(ÀI — A) como sigue: 


A +44 +3 24 +6 -4 
adj (AI — A) = 34 + 7 MA+21-3 -2+2 
A+1 2 A -7 


Claramente, no existe un divisor común d(A) de todos los elementos de adj(AL— A). Por tanto d(A) = 1. 
consecuencia, el polinomio mínimo pH(A) está dado por la ecuación 


¡AI — Al 
$à) = “dm 


Así, el polinomio mínimo H(A) es el mismo que el polinomio característico. 
Dado que la ecuación característica es 


AI A|=27+31?-71-17=0 


= JAI — Al 


se obtiene 
H(A) = 1434? -7 — 17 


Al identificar los coeficientes a, del polinomio mínimo (que en este caso es el mismo que el polin 
característico), se tiene 


ar = 3, da = 1, da = -17 


La inversa de A se puede obtener entonces a partir de la ecuación (5-134) como sigue: 


A`! = L(A? + aA + aT) = EA? +34 = 7D) 
PA 17 
if 7 0 -4 1 2 0) 00 
=5 =2 7 8|+313 -1 -2|- 70 1 O 
-2 2 9 1 0 -3 0 0 1 
1 3 6 -4 
==|7 -3 2 
Ml 2 27 
23 6 -£ 
17 17 17 
ae an iz 
17 17 17 
A E 
17 17 17 


Problema A-5-13 
Demuestre que la inversa de zI — G puede estar dada por la ecuación 

iu _ adj(z1-G) 

(zI - G) Aea. TE 


1z"! + Hiz”? + Hz”? + ++ + Hapa 3 
- pe A A (5-13 
Izl — G| 
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donde 
H,=G+al 
H- = GH, + æl 
H,-ı = GH„-2 + an~ l 
H, = GH,-, + a,1=0 
y 4,, az, .. . , a, son los coeficientes que aparecen en el polinomio característico dado por 


lZIl-Gi|=2"+a127 + az"? + o +4, 


Demuestre también que 


a= -trG 

a = —i tr GH, 
1 

ân = --trGH,.-; 
n 


Para simplificar la deducción, suponga que n = 3. (Se puede fácilmente extender la deducción al caso de 
cualquier entero positivo n.) 


Solución Observe que 
(zI — GU? + H,z + H2) = 271 - 22G + 27H, — GH, + zH; — GH, 
=Y1-2G+2(G+aD - 2G(G + a1) 
+ z[G(G + a, + a1] — G[G(G + a, 1) + a1] 
z I+ az’ I+ azi + al- G? 
-a G’ -aG -al (5-136) 


1i 


El teorema Cayley—Hamilton (vea el problema A-5-9) indica que una matriz G de n x n satisface su 
propia ecuación característica. Dado que n = 3 en el caso presente, la ecuación característica es 


|\zI — G| = 2° + az? + az +a = 0 
y G satisface la ecuación siguiente: 
G? +a¡G?+a,G+a1=0 
Por tanto, la ecuación (5-136) se simplifica a 
(zI - G)(Iz? + Hız + H2) = (2? + a,2? + az + as)1 = |21 — Gl] 


En consecuencia, 


_ (z1 - G)(1z? + Hız + H2) 


: zi- Gj 
es decir 
I-07 = I? +Hz +H 


izī — GI 


que es la ecuación (5-135) en el caso de n = 3. 
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A continuación se demostrará que 


a= —trG 
da = —3trGH, 
43 = — 1 tr GH: 


Se transformará G en una matriz diagonal si G involucra n vectores propios linealmente independi 
(donde n = 3 en el caso presente) o en una matriz en la forma canónica Jordan si G incluye menos 
vectores propios linealmente independiente. Es decir, 


P~ GP = D = matriz en forma diagonal 
o bien 
S! GS = J = matriz en forma canónica diagonal 


donde las matrices P y S son matrices de transformación no singulares. 
Como el cálculo que sigue se aplica independientemente de si la matriz G pueda ser transfo 
en una matriz diagonal o en una matriz en la forma canónica Jordan, se utilizará la notación 


T'GT=D 
donde D representa ya sea una matriz diagonal o una matriz en la forma canónica Jordan, según 


caso. 
En lo siguiente primero se demostrará que 


trG = trÔ 
tr GH: tr ÔÊ, 
tr GH: = tr PA, 


donde 
A, =D+a,l 
Â. = DÁ, +al 


Entonces se mostrará que 


a = -tr Ô 

@=-—}tr DÁ, 

a= -itr DH 
Observe que desde 

trAB = trBA 


se tiene 
tr TÔT- = tr (TDT) = tr (150) = trb 
Observe asimismo que 
tr(A + B) =trA +trB 
Y ahora se tiene 
trG = tr TDT"! =trb 
tr GH, = trG(G + a, I) = trG? + tra, G 
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tr TÔ? T’ + tra, TDT" 

trD? + tra, Ô = tr (ÑD? + a, D) = trbñ, 
trG(GH, + a21) = tr G[G(G + a I) + a21] 
tr (G? + a, G? + aG) 

tr TÔ’ T! + tra, TDT" + tra, TÔT 
trD* + tra, D? + tra, D 

tr (D + a,D? + a,D) = tr DÊ, 


i 


il 


tr GH, 


Se escribe 
Sane E 
T ’GT=D=|0 p * 
0 0 P3 


donde un asterisco significa “ya sea 0 o 1”. Entonces 
Iz1 - D| = z’ — (pi + p2 + p3)2? + (pip2 + P2P3 + P3P1)Z — Pi paps 
=2+a127+ az +a 


donde 
ar = —(pi + p + p3) 


42 = pı pz + P2P3 + P3P1 
43 = —P1rP2P3 
Observe que 
trÔ = pı + p2 + ps = -a 
trdñ, = trÔ(Ô + a, 1) = trÔ? + tra, Ô 
= pi + p3 + p3- (pi + pz + pps + pa + po) 
= —2(pip2 + p2p3 + P3Pp1) = —2a2 
tr ÔÊ: = trD(DÁ, + a1) = tr (D° + a, D? + a,D) 
= tr? + tra, Ô? + tra, Ô 
= (pi + p} + p3) — (Pı + pa + papi + p2 + p3) 
+ (PiP + P2P3 + pP3pi)\(Pi + pa + ps) 


= 3p,p2p3 = —-3a3 

Por tanto, se ha demostrado que 

a = -trD = -trG 

Q= -} trÒÂ, = —3trGH, 

a, = —LtrDM»= —¿trGH, 

Problema A-5-14 
Considere el siguiente sistema oscilador: 
Y(s) w* 


(O) +0 





2 
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Obtenga la representación en el espacio de estado en tiempo continuo del sistema. A continuación di 
el sistema y obtenga la representación en el espacio de estado en tiempo discreto. También obte 
función de transferencia pulso del sistema discretizado. 


Solución Para la función de transferencia dada tenemos 


ğ+toy=ow u 


Se define 
xy 
x= 2 y 
2 07 


Entonces, se obtiene la representación en el espacio de estado de tiempo continuo siguiente: 
X2 —w 0 X2 w 
Z X1 
y = (1 ol a 


La representación en el espacio de estado en tiempo discreto del sistema se obtiene como sigue. 


observar que 
A= | e al B = [e] 
~w 0 w 











se tiene 
=1 
AT _ pol ava=o9 yu? 70 
G=e SL "[(sI- A) ”] ssl 217 
s w 
2 2: 2 + 2 
= ga ts ei _| coswT senwT 
al —w s -senwT coswT 
Stw Pto 
y 


T A A r cos wÀ senol 0 
H = pad da |B = o | =senwA coswA dà ü 
_| 17 coswT 
sen wT 
Por tanto, la representación en el espacio de estado en tiempo discreto del sistema oscilatorio se conviene 


xa((k + 1)T)| | coswuT senoT || x(kT) Ba 1 — coswT u(kT) 
xl(k + 1)T) -senwT coswT || x(kT) sen wT 
5 xı(kT) 
y(kT) T [1 e 
La función de transferencia pulso del sistema discretizado se puede obtener a partir de la ecu: 
(5-60): 


F(z) = C(zI — G) 'H + D 
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Si se observa que D es cero, se tiene 


ü of” — coswT  —senwT Na ~ aa 


li 


F(z) 


senwT z — coswT sen wT 


1 i o| — coswT senwT P — cos a 


2? — 2z coswT + 1 —senwT z —coswT senwT 


_ Q- coso +1) 
z’ — 2z coswT +1 


Por tanto, 


Y(z) 1 — coswT)(1 +2 Mz" 


a e 
U(2) Pe) 1-22 * coswT + z7? 


Observe que la función de transferencia pulso obtenida de esta forma es la misma que la obtenida al 
tomar la transformada z del sistema antecedido por un retenedor de orden cero. Esto es 


Y(z)_ Dd RE A El s 
KORSI s +w AER la + 
Sa ro 1-27 coswT 

=s l: =z! 1-22 coswT +z? 
(1 — coswT)(1 + 27 z* 
1-22? coswT + 27? 


Por tanto, se obtiene la misma expresión para la función de transferencia pulso. La razón de lo anterior es 
que la discretización en el espacio de estado proporciona un equivalente del retenedor de orden cero del 
sistema en tiempo continuo. 


Problema A-5-15 


Considere el sistema mostrado en la figura 5-84). Este sistema implica polos complejos. Es estable pero 
no es asintóticamente estable en el sentido de Liapunov. La figura 5-8b) muestra una versión discretizada 


Uis} 2 Yis) 





s? +4 


(a) 





—>+> 
ôr Y(z) 
(b) 
Figura 5-8 a) Sistema en tiempo continuo del problema A-5-15; b) versión discretizada del 


sistema. 


www.FreeLibros.me 


360 








Análisis en el espacio de estado Capa 


del sistema en tiempo continuo. El sistema discretizado también es estable pero no es asintóticar 
estable. 

Suponiendo una entrada escalón unitario, demuestre que el sistema discretizado puede me 
oscilaciones ocultas cuando el período de muestreo T adopta cierto valor. 


Solución La respuesta del sistema en tiempo continuo que se muestra en la figura 5-8a) es 








s 1 s 
OS ads ed 
Por tanto, 
y(t) = cos21 


[Observe que el valor promedio de la salida y(ż) es cero y no la unidad.] La respuesta y(ż) en funcio 
t aparece en la figura 5-9a). 


y (e) 


1 


(a) 





(b) 





te) 


Figura 5-9 a) Respuesta en escalón unitario y(1) del sistema en tiempo continuo mostrado 
en la figura 5-84); b) gráfica de y(k7) en función de AT del sistema discretizado que se 
presenta en la figura 5-86) cuando T= + 7 segundos; c) gráfica de y(4T) en función de 4T del 
sistema discretizado cuando T = rr segundos. (En el diagrama se muestran las oscilaciones 
ocultas.) 


www.FreeLibros.me 


Capitulo 5 Problemas de ejemplo y soluciones 361 


La función de transferencia pulso del sistema discretizado mostrado en la figura 5-18b) es 


EA AR A e Sa s 
tO -e| e IS Pe 
1 ~ z` cos2T 
1-27? cos2T +z” 
Por tanto, la respuesta al escalón unitario se obtiene como sigue: 
„(Q270 -z cos2T)_1 
Yle) 1-22 c082T +2? 1-z` 
2 1 7 c0s2T 
1-22 * cos2T + z7? 


La respuesta y(kT) se hace oscilatoria si T= nm segundos (n= 1, 2, 3, . . .). Por ejemplo, la respuesta del 
sistema discretizado cuando T = + 7r segundos se convierte en: 


= (1-27) 





Y(z) = lg 2 


1427? 
Por tanto, 
y(0) = 1 
y(T)=0 
yQT)=-1 
y(3T)=0 


y(4T) =1 


Una gráfica de y(kT) en función de ÁT cuando T= + 7r segundos aparece en la figura 5-9). Claramente, 
la respuesta es oscilatoria. Si el período de muestreo T fuera de m segundos, es decir T= m, entonces 


=14+ 242742 


La respuesta y(kT) para k=0, 1, 2, . . . es constante e igual a uno. La gráfica de (kT) en función de kT 
cuando T = 7 se muestra en la figura 5-9c). 

Observe que si T = m segundos (de hecho, si T= nm segundos, donde n= 1, 2, 3, . . .) la secuencia 
de respuesta al escalón unitario se conserva en la unidad. Dicha respuesta puede darnos la impresión de 
que y(£) es constante. La respuesta real no es constante ya que oscila entre 1 y —1. Por tanto, la salida del 
sistema discretizado cuando T= m segundos (o cuando T= nv segundos, donde n= 1,2, 3,...,) muestra 
oscilaciones ocultas. 

Observe que dichas oscilaciones ocultas (inestabilidad oculta) sólo ocurren para ciertos valores 
del periodo de muestreo 7. Si se varía el valor de T, estas oscilaciones ocultas (inestabilidad oculta) 
aparecerán en la salida como oscilaciones explícitas. 


Problema A-5-16 
Aunque el sistema con doble integrador es dinámicamente simple, representa una clase de sistema im- 
portante. Un ejemplo de sistema con doble integrador es el sistema de control de altitud de un satélite, 
que se puede describir como 
Jó=u+v 
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donde J es el momento de inercia, 0 es el ángulo de altitud, u es el par de control, y v es el par de 
perturbación. 

Considere el sistema con doble integrador en ausencia de entrada de perturbación. Se define Jð = 
y. Entonces la ecuación del sistema se convierte en 


j=u 


Obtenga una representación en el espacio de estado en tiempo continuo del sistema. A continuación 
obtenga un equivalente en tiempo discreto. También obtenga la función de transferencia pulso para el 
sistema en tiempo discreto, 


Solución Defina 
xy 
X= y 


Entonces la ecuación de estado en tiempo continuo y la ecuación de salida se convierten en 


AN REA: 
y=[ af] 


El equivalente en tiempo discreto de estos sistemas puede estar dado por 
x((k + 1)T) = Gx(kT) + Hu(kT) 
y(kT) = Cx(kT) 


Las matrices G y H se obtienen de las ecuaciones (5-73) y (5-74). Al observar que 


SEI f 


z,ar_|1 T 
G=e -[; a 


-Fra (E Jaf- 


Por tanto, la ecuación de estado en tiempo discreto y la ecuación de salida se convierten en 


se tiene 


2 


T 
a+ om] [i Taen] 12 
[Bétani DLE)" 7 pun 


yT) = [1 aaen] 


La función de transferencia pulso del sistema en tiempo discreto se obtiene a partir de la ecuación 
(5-60) como sigue: 
Y(z) 


UG) = F(z) = C(21- G)'H + D 


www.FreeLibros.me 


Capítulo 5 Problemas de ejemplo y soluciones 363 


T? 


=1]| — 
2=d. =TI 2 
(1 ol 0 sa f +0 


Mc +2) 
Xz-1f 2l- z`”F 


Problema A-5-17 
Demuestre que la siguiente forma cuadrática es definida positiva: 


V(x) = 10x? + 4x3 + x3 + 2x1x2 — 2x2X3 — 4x1 X3 


Solución La forma cuadrática V(x) se puede escribir como sigue: 


10 1 -2| x 
V(x) = x7 Px= |x} x x} 1 4 -1fx 
-2 -1 1 X3 
Al aplicar el criterio de Sylvester, se obtiene 
10 1 -2 
10>0 PY J>0 11.4 1 
2-1 1 








En vista de que todos los menores principales sucesivos de la matriz P son positivos, V(x) es definida 
positiva. 


Problema A-5-18 
Considere el sistema definido por: 


x=f(1,1) 


Suponga que 
f(0, 1) =0, para todos t 


Suponga que existe una función escalar V(x, £) que tiene primeras derivadas parciales continuas. Si V(x, 
t) satisface las condiciones: 


1. V(x, £) es definida positiva. Esto es, V(0, £) = 0 y V(x, £) 2 a([IxI) > O para toda x * 0 y para toda 
t, donde a es una función escalar no decreciente continua tal que a(0)=0. . 

2. La derivada total y(x, t) es negativa para toda x + 0 y para toda f, es decir Vx, t) <-—vlIxip < 0 

para toda x + 0 y toda £, donde y es una función escalar no decreciente continua tal que y(0) = 0. 

Existe una función escalar no decreciente continua £ tal que (0) = 0 y para toda ¢, V(x, 1) < B(IxI)). 

4. a(lIxi) se aproxima al infinito conforme |ix|| aumenta en forma indefinida, es decir 


u 


ajixl] > o, cuando ||x]| > æ. 


Entonces el origen del sistema, x = 0, es uniforme y asintóticamente estable global. (Éste es el teorema de 
estabilidad principal de Liapunov.) 
Pruebe este teorema. www.FreeLibros.me 
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Solución Para probar la estabilidad asintótica uniforme global, se necesita verificar lo siguiente: 


1. El origen es uniformemente estable. 
2. Cualquier solución está acotada en forma uniforme. 
3. Todas las soluciones convergen al origen cuando £ > œ uniformemente en to y ||xoll < 6, do 


fijo, pero arbitrariamente grande. Es decir, dados dos números reales ô > 0 y y > 0, existe 
número real 7(u, ô) tal que 


Ixol| = ô 
lo que implica que 
OCE; Xos 11 < 1, para toda t > to + T(x, 6) 


donde q(t; Xo, to) es la solución de la ecuación diferencial dada. 


En vista de que £ es continuo y B(0)=0, se puede escoger una (€) > 0 tal que B(8) < a(€) para cual 
€ > 0. La figura 5-10 muestra las curvas a([Ix) B(IIxII) y V(x, £). Al observar que 


V(d(t; xo, to), t) — Vo, to) = T V(d(T; Xo, to), 7) dr < 0, t> bh 


si lx, ]| < 8, siendo f arbitrario, se tiene 
a(e) > B(8) = V(xo, to) = V(P(t; Xo, to), 1) = a(lló(t; xo, to)II) 
para todos t > fọ. Dado que a es no decreciente y positivo, esto implica que 
llb(t; Xo, toll < €, for £ > fo, ||Xol| = 8 
Por tanto, se ha demostrado que para cada número real €> 0 existe un número real ô> 0 tal que |x 


implica que [|H(t; Xo, tp)I| < € para toda £ > tọ. Así, se ha probado la estabilidad uniforme. 
Ahora se probará que |I(ć; xo, to)[| > 0 cuando £ > œ en forma uniforme en fa y ||xol| < 6. Se 







Bi x1) 





alix i) 


0 Ste) € IXI 


Figura 5-10 Curvas a(iixi), B(IxI) y K, À 
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cualquier 0 < u < |x|] y se encuentra una v(4) > 0 tal que B(v) < a(1). Se denota e'(u, 8) > 0 el mínimo 
de la función continua no decreciente y(]|x]|) en el conjunto compacto y(u) < |x|] < €(S). Se define 


B(9) 


>0 
€'(u, ô) 


T(u, 0) = 
Suponga que [Id(£; Xo, t,)I| S v Sobre el intervalo de tiempo t € 1 < f, = tọ + T. Entonces se tiene 


0 < alv) = V(d(t13 Xo, to), h) E VlXo, to) — (h — toje’ = B(8) - Te' =0 


lo que resulta en una contradicción; por tanto, para un valor de en el intervalo £, < £ S f,, como es un valor 
arbitrario f,, se tiene 


lxall = (Ip(t2; xo, to) = v 
Por tanto, 
allip(t;x2, 12)1) < V(d(t; x2, 12), 1) = V(x2, t) 5 B(v) < a(u) 
para toda f > f. Entonces, 
IPCE; xo, to) < u 


para toda 12 t¿ + T(u. ô) 2 £,, lo que prueba la estabilidad asintótica uniforme. Dado que «(lx|) — = 
conforme [Ix|| ><. existe para el caso de una ô arbitrariamente grande, una constante e(ô) tal que B(6) < 
a(€). Lo que es más, en vista de que e(ô) no depende de ry, la solución P(£; Xo. t) está limitada en forma 
uniforme. De esta manera se ha probado la estabilidad asintótica uniforme global. 


Problema A-5-19 
En el análisis del plano z, una matriz G de n x n cuyos n valores propios tienen magnitudes menores que 
la unidad se conoce como una matriz estable. Considere una matriz P hermítica (0 simétrica real) de n x 
n que satisface la ecuación matricial siguiente: 


G*PG - P= -Q (5-137) 
donde Q es una matriz de n x n definida positiva hermítica (o simétrica real), Pruebe que sí la matriz G 
es estable, entonces una matriz P que satisface la ecuación (5-137) es única y es definida positiva. Pruebe 
que la matriz P puede estar dada por 

P = Y (G*) QG* 

k=0 

Pruebe también que a pesar de que el lado derecho de esta última ecuación es una serie infinita la matriz 
es finita. Por último, pruebe que si se satisface la ecuación (5-137) mediante matrices definidas positivas 
P y Q, entonces la matriz G es una matriz estable. Suponga que todos los valores propios de G son 
distintos y todos los vectores propios de G son linealmente independientes. 


Solución Suponga que existen dos matrices P, y P, que satisfacen la ecuación (5-137). Entonces 


G*P,G - P, = -Q (5-138) 


G*P,G —- P, = -Q (5-139) 
Al sustraer la ccuación (5-139) de la ecuación (5-138), se obtiene 


G*PG-P=0 (5-140) 


www.FreeLibros.me 


366 








Análisis en el espacio de estado Capítulc 5 
donde 
Ê =P, -P 
Observe que si P +0, entonces existe un vector propio x; de la matriz G tal que 
Px,+0 
Se define el valor propio asociado con la vector propio x, como A,. Entonces 
Gx; = AX; 
Por tanto, de la ecuación (5-140), se obtiene 
G*PGx, — Êx; = G*Pr,x, — Êx; = (A; G* — DPx, = 0 (5-141) 


La ecuación (5-141) implica que A;' es un valor propio de G*. Dado que |A/| < 1, se tiene que |A,'| > L 
Esto contradice la suposición de que G es una matriz estable. Por tanto, P debe ser una matriz cero, o es 
necesario que 


P, =P, 


Por tanto, se ha probado la unicidad de la matriz P, que es la solución a la ecuación (5-137). 
Para probar que una matriz P, que satisface la ecuación (5-137), puede estar dada por 


P = 5, (G*)0G* (5-1 
k=0 


se puede volver a escribir la ecuación (5-142) como sigue: 


P = (Gr) QG? + S (G) QG =Q + SÈ (coc |s 
= Q + G*PG 


Por tanto, se satisface la ecuación (5-137). Dado que la matriz Q es una matriz positiva definida, de 
ecuación (5-142) la matriz P también es positiva definida, 

Ahora se probará que, aunque la matriz P dada por la ecuación (5-142) es la suma de una 
infinita, se trata de una matriz finita. En razón de las suposiciones hechas en el enunciado del probl 
los valores propios A, son distintos y los vectores propios de G son linealmente independientes. Para 
valor propio A, asociado con el vector propio x, se tiene 

Gx, = AX; 


Al usar esta relación, se puede simplificar x| XC QG‘ px Primero se nota que 
x*(G* QG? x; = (x7 G*)(G*QG)(Gx,) = A; x7 G*QGA; x; 
= la, (x7 G*)Q(Gx,) = APANA: x) 
= JAPA? x Qx: 
Entonces, al usar ese tipo de simplificación, se tiene 
xi [3 (G*)* oc'h = xf Qx; + x7 G*QGx; + x(G*) QG? x; + x* (GP QG? x: +- 
E = xš Qx: + A/Aix Qx + JPA Qx + JAA? Qx: 


+ . 
= x*Qx(1 + lA? + Jal + JA + >.) 
1 
X; Qx? mi Jaf 
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Esto prueba que 
2 (G*)QG* 
k=0 


es una matriz finita. 

Finalmente, se probará que si la ecuación (5-137) es satisfecha por las matrices definidas positivas 
P y Q, entonces la matriz G es una matriz estable. Se define el vector propio asociado con un valor propio 
A, de G como x,. Entonces 


Gx; = À; Xi 
Premultiplicando ambos lados de la ecuación (5-137) por x; y postmultiplicando ambos lados por x,, se 
obtiene 
x” G*PGx, — x*Px, = —x* Qx; 
Por tanto, 
AX EPA Xx: — x Px; = —x* Qx; 
o bien 
(Jà: — Dx? Px; = —xf Qx; 
En vista de que tanto x; Px, y x? Qx, son definidas positivas, se tiene 
lA? 1<0 
o bien 
lA] < 1 


Por tanto, se ha probado que la matriz G es una matriz estable. 
Las pruebas y deducciones presentadas aquí se pueden extender al caso en el que la matriz G 
incluye valores propios múltiples y vectores propios múltiples. 


Problema A-5-20 
Considere el sistema 


x(k + 1) = H(x())x(k) 


y 
| Suponga que existen constantes positivas c,, C,, . . . , €, tales que 


n 


(D max l Smo) <1, paratodax 


j=l 5j 
o bien 


n 


' (2) max [3mo] <1, para toda x 
; 


ial Yj 


Demuestre que en cualquiera de estos casos H(x)x es una contracción para toda x y por tante el estado de 
equilibrio del sistema es asintóticamente estable global. 


Solución En el caso 1, la norma se define mediante 
ixi = max {clx} 


Entonces 





È a)y |} = max [š$ ENE cl 


¡HGox]| = max la 
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n 


= max | 2 E col] max (c;[x;[) < dsd {obh} 
i (16 j 


= (xi 
lo que verifica que H(x)x es una contracción. 


En el caso 2, la norma se define mediante 


n 


Ixl = 2 cbr 


i=l 


Entonces 








HGOxl| = 2 ci S hx 
= È È huol- 
Semo} 


i=1Ċj j= 


n 
cx] < 2 cx, 


sS max Í 
j=1 


= IIxl 


que muestra que H(x)x es una contracción. 
Ahora considere una función escalar V(x) = |Ix]]. Claramente, V(x) = ||x|| es positiva definida + 


AV(x(k)) = V(x(k + 1)) — V(x(k)) 
= [[H(x(4 ))x(4) 11 — IIx(4) 11 < 0 


AV(0) =0 
Así, AV(x) es definida negativa. Por tanto, para el sistema considerado V(x) = ||x|| es una función 
Liapunov y, en razón del teorema 5-5, el origen del sistema es asintóticamente estable global. 
Problema A-5-21 
Pruebe que si todas las soluciones de 
x(k + 1) = Gx(k) (5-1 


donde x es un vector n y G es una matriz constante de n x n, tiende a cero conforme k se acerca al infin 
entonces todas las soluciones del sistema 


x(k + 1) = Gx(k) + Hu(k) (5-1 


donde H es una matriz constante de n x r, están acotados, considerando que el vector de entrada u(A). 
es un vector r, también está acotado. 


Solución Dado que u(k) está acotado, existirá una constante positiva c tal que 
luk) <c,  k=0,1,2,... 


La solución de la ecuación (5-144) está dada por 


x(k) = G*x(0) + Y) may - 1) 
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Por tanto, 
k k 
IxGON < IGIIFIx(O)!) + c 2 IGE = NGO + lim c 2 11H! 


En vista de que el origen del sistema homogéneo dado por la ecuación (5-143) es asintóticamente estable, 
axisten constantes positivas a y b (0 < b < 1) tales que 


0 < [IG|* < ab* 


Entonces 





k k 
lim Y [GI < lim Y ab = a 


k>% j=] k>a ju 1 1- b 
Y por tanto, 


! 
Ix(K)I < alx(O)i + ella 





Así se ha probado que ||x(K)|| está acotado. 
iriblema A-5-22 
Considere el sistema definido por las ecuaciones 
x(k + 1) = 2x,(k) + 0.5x2(k) — 5 
x(k + 1) = 0.8x2(k) + 2 
Determine la estabilidad del estado de equilibrio. 
Solución Se define el estado de equilibrio en la forma 
x(k) = Xie, x(k) = Xz 
Entonces este estado de equilibrio puede ser determinado a partir de las dos ecuaciones simultáneas 
siguientes: 
Xie = 2X1e + 0.Sx2. — 5 
Xz = 0.8x + 2 
es decir 
Xie = 0, Xz = 10 


El estado de equilibrio es, por lo tanto, (0, 10). 
Consideremos ahora un nuevo sistema de coordenadas con el origen en el estado de equilibrio. Se 
definen 


X1(k) = x(k) 
XAk) = x(k) — 10 
Entonces las ecuaciones del sistema se convierten en 
f(k + 1) = 2x,(k) + 0.5[£(k) + 10] — 5 
Ak + 1) + 10 = 0.8[£2(k) + 10] + 2 


Es + o! £ E A 
Ak +1)|7 |0 0.8) &(k) 
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Para determinar la estabilidad del origen del sistema en el nuevo sistema de coordenadas, se aplica 
ecuación de estabilidad de Liapunov dada por la ecuación (5-90): 


2 0 Pu Puma 2 0.5 _ Pu Pu Er 9 0 

0.5 0.8 Pr Pz 0 0.8 Piu Pz 0 0.35 
donde se escoge Q como una matriz definida positiva con elementos que simplifiquen el cá 
involucrado. Al resolver esta última ecuación en función de la matriz P, se obtiene 


P= Pu Pre| -3 5 

P2 Pa 5 10 
Al aplicar el criterio de Sylvester para la definición positiva, se encuentra que la matriz P no es de 
positiva. Por tanto, el origen (estado de equilibrio) no es estable. 


La inestabilidad del estado de equilibrio puede, naturalmente, determinarse mediante el mét 
la transformada z. Primero se elimina X, de la ecuación de estado. Entonces, se tiene 


X1(k + 2) — 2.8%, (k + 1) + 1.6x,(k) = 0 
La ecuación característica para el sistema en el plano z es 
22-282 +16=0 
es decir 
(z - 2Mz - 0.8) =0 
Por tanto, 
z=2, z=0.8 


Dado que el polo z = 2 está localizado fuera del círculo unitario en el plano z, el origen (estade 
equilibrio) es inestable. 


PROBLEMAS 


Problema B-5-1 
Obtenga una representación en el espacio de estado en la forma canónica controlable del siguiente 
ma con función de transferencia pulso. 


YG)_ 2'+2z? 
U(z) 1+42 7 +3z* 





Problema B-5-2 
Obtenga una representación en el espacio de estado en la forma canónica observable del sistema 
función de transferencia pulso siguiente. 

Y(z) _ 2 +47? 
U(z) 1+6z2* + 117? +62? 





Problema B-5-3 
Obtenga una representación en el espacio de estado en la forma canónica diagonal del sistema com 


ción de transferencia pulso siguiente. 
Y(z)_1+6z +82? 
U(z) 1+4z2* +32 * 
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Problema B-5-4 
Obtenga una representación en el espacio de estado del sistema descrito por la ecuación 
y(k +2) + y(k + 1) + 0.16y(k) = u(k + 1) + 2u(k) 


Problema B-5-5 
Obtenga la ecuación de estado y la ecuación de salida correspondiente al sistema mostrado en la figura 5-11. 





Figura 5-11 Diagrama de bloques de un sistema de control. 


Problema B-5-6 
Obtenga la ecuación de estado y la ecuación de salida del sistema mostrado en la figura 5-12. 


Problema B-5-7 
Obtenga una representación en el espacio de estado del sistema mostrado en la figura 5-13. 


Problema B-5-8 
La figura 5-14 muestra un diagrama de bloques de un sistema en tiempo discreto de varias entradas y 
varias salidas. Obtenga las ecuaciones en el espacio de estado del sistema considerando x,(40, (40) y 
x(k) tal y como se muestran en el diagrama como variables de estado. A continuación defina las nuevas 
variables de estado tales que la matriz de estado se convierta en una matriz diagonal. 


Problema B-5-9 
Obtenga la ecuación de estado y la ecuación de salida para el sistema que se muestra en la figura 5-15. 


Problema B-5-10 


Obtenga una representación en el espacio de estado del sistema de control en tiempo discreto que se 
muestra en la figura 5-16. 
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Figura 5-13 Diagrama de bloques para el sistema de control del problema B-5-7. 


Problema B-5-11 
Obtenga una representación en el espacio de estado del sistema siguiente en la forma canónica diago 
Y(z) _ 2d? 
U(z} 1+0.72* + 0.1227? 








Problema B-5-12 
Obtenga una representación en el espacio de estado del sistema con función de transferencia pulsa 
guiente tal que la matriz de estado sea una matriz diagonal: 


Y(z) _ 1 
U(Z) (+ DG +2 +3) 





Asimismo obtenga las variables de estado iniciales x,(0), x,(0) y x¿(0) en términos de y(0), y(1) y » 
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Figura 5-14 Diagrama de bloques del sistema en tiempo discreto de varias entradas y varias salidas del problema B-5-8. 


u(k) 





Figura 5-15 Diagrama de bloques de un sistema de control. 
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| 












Figura 5-16 Sistema de control en tiempo discreto. 


Problema B-5-13 
Una representación en el espacio de estado del sistema escalar de ecuaciones en diferencias 


y(k + n)+a(k)y(k+n—1)+-:- + a(k)y(k) 
= bo(k)u(k + n) + bi(k)u(k + n — 1) + +- + ba(k)u(k) 


donde k = 0, 1, 2, .. . , puede estar dada por 


x(k + 1) 0 Do cer 0 0 x(k) h(k) 
x(k +1) 0 0O > 0 0 x(k) h(k) 
: =} : : : : 2 j+] © Julk) 
Xa-i(k + 1) 0 De O EOS 
x(k + 1) =an(k) =a0(k) >> a(k) ak) || xalk) h(k) 


y(k) = x(k) + bo(k — n)u(k) 


Determine A (k), h(k). . . . , h,(k) en términos de a(k) y de b(k), donde i= 1,2,...,nyj=0, 1... 
También determine los valores iniciales de las variables de estado x,(0), x,(0), . . . , x,(0) en térmi 
la secuencia de entrada u(0), u(1),...., u(n—1) y la secuencia de salida (0), (1), ...., y(n — 1). 


Problema B-5-14 
Si el polinomio mínimo de una matriz G de n x n involucra sólo raíces distintas, entonces la inversa 
~ G puede estar dada por la siguiente expresión: 





A X z 
(zI - G) = 3 (E 
k=12 7 Zk 
donde m es el grado del polinomio mínimo de G y X, son las matrices de n x n que se dete: 
mediante 
g,(G) = ES T gi(22)X2 aria 82m X m 
donde 
g(G)= (G- 2D, gz) = (2-2) 
donde j = 1, 2,...,m yz, es cualquiera de las raíces del polinomio mínimo de G. 


Utilizando la ecuación (5-145), se obtiene (zł — G)* para la siguiente matriz G de 2 x 2: 


El 
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Problema B-5-15 
Obtenga la función de transferencia pulso del sistema definido por las ecuaciones 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) + Duí(k) 


donde 
=4 ~az? ~a; 1 
G= 1 0 0 j, H=|j0 
0 1 0 0 


C = [b, — a; bo: b2 — az bo: b3 — az bo], D = bo 
Problema B-5-16 
Encuentre la función de transferencia pulso del sistema definido por 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) + Du(k) 


donde A hı 
G=|-a 0 1j, H=|A 
43 0 0 hz 

C=[1 0 0), D = bo 


Problema B-5-17 
Obtenga la representación en el espacio de estado para el sistema definido en la siguiente matriz de 


transferencia pulso: 
1 1+27? 
Zi =1 — `i 
ea de G 
Y(G) 1 1+2z0 Uzlz) 
1 +0.6z7! 1+0.67 








Problema B-5-18 
Considere la ecuación de estado en tiempo discreto 


x(k +1)j_| 0 1 || x(k) 
x(k + 1) —0.24 -1 x(k) 
Obtenga la matriz de transición de estado W(k). 


Problema B-5-19 
Considere el sistema definido por 


x(k + 1) = Gx(k) + Hu(x) 
y(k) = Cx(k) + Du(k) 


donde la matriz G es una matriz estable. 
Obtenga los valores en régimen permanente de x(k) y y(k) cuando u(k) es un vector constante. 
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x(k + 1) = Gx(k) 


donde G es una matriz estable. 
Demuestre que para una matriz Q definida positiva (o semidefinida positiva) 


J = Y x*(k)Qx(k) 
k=0 
puede darse por 


J = x*(0)Px(0) 
donde P = Q + G'PG. 


Problema B-5-21 
Determine una función de Liapunov V(x) para el sistema siguiente: 


x(k AE 1) _ 1 -1.2 xi(k) 
xAk+1| |05 0 x(k) 
Problema B-5-22 


Determine la estabilidad del origen del sistema siguiente en tiempo discreto: 


x(k +1) 1 3 0j x(k) 
xAk+1|=|-3 -2 -3 |i x(k) 
x(k + 1) 1 0 0[|x(k) 


Problema B-5-23 
Determine la estabilidad del origen del sistema siguiente en tiempo discreto: 


x((k +1)T)| _| cosT senT || x (kT) 
x(k + 1)T)}| | -senT cosT || x(kT) 


Problema B-5-24 
Considere el sistema definido por las ecuaciones 


x(k + 1) = x(k) + 0.2x(k) + 0.4 
x(k + 1) = 0.5x,(k) — 0.5 


Determine la estabilidad del estado de equilibrio. 
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Ubicación de polos y diseño 
de observadores 








INTRODUCCIÓN 


En la primera parte de este capítulo se presentarán dos conceptos fundamentales de los sistemas de 
control: controlabilidad y observabilidad. La controlabilidad se ocupa del problema de poder dirigir 
un sistema de un estado inicial dado, a un estado arbitrario. Un sistema es controlable si puede, 
mediante un vector de control no acotado, transferir dicho sistema de cualquier estado inicial a 
cualquier otro estado, en un número finito de periodos de muestreo. (Por lo tanto, el concepto de 
controlabilidad trata de la existencia de un vector de control que puede causar que el estado del 
sistema llegue a algún estado arbitrario.) 

La observabilidad se ocupa del problema de determinar el estado de un sistema dinámico a 
partir de observaciones de los vectores de salida y de control en un número finito de períodos de 
muestreo. Un sistema es observable si, con el sistema en el estado x(0), se puede determinar el estado 
a partir de la observación de los vectores de salida y de control a lo largo de un número finito de 
periodos de muestreo. 

Los conceptos de controlabilidad y observabilidad fueron introducidos por R. E. Kalman. 
Tienen un papel importante en el control óptimo de sistemas multivariables. De hecho, las condicio- 
nes de controlabilidad y observabilidad pueden hacer posible la existencia de una solución completa 
a un problema de control óptimo. 

En la segunda parte del capítulo analizaremos el método de diseño de ubicación de polos y los 
observadores de estados. Observe que el concepto de controlabilidad es la base para solucionar el 
problema de ubicación de polos y el concepto de observabilidad juega un papel importante para el 
diseño de los observadores de estados. El método de diseño basado en la ubicación de polos junto 
con los observadores de estados, es uno de los métodos de diseño fundamentales para los ingenieros 
de control. Si el sistema es de estado completamente controlable, entonces es posible seleccionar los 
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polos en lazo cerrado deseados en el plano z (o las raíces de la ecuación característica) y se podrá 
diseñar el sistema que proporcione estos polos en lazo cerrado. El método de diseño de ubicar los 
polos en lazo cerrado en localizaciones deseadas en el plano z, se conoce como técnica de diseño de 
ubicación de polos; es decir, en dicha técnica se realimentan todas las variables de estado, de tal 
forma que todos los polos del sistema en lazo cerrado quedan ubicados en las localizaciones desea- 
das. En los sistemas reales de control, sin embargo, quizá no se puedan medir todas las variables de 
estado, en cuyo caso, no todas las variables de estado estarán disponibles para su realimentación 
Para poner en práctica un diseño basado en la realimentación del estado, será necesario estimar las 
variables de estado no medibles. Esta estimación puede ser efectuada mediante el uso de observado- 
res de estados, mismos que se analizarán en detalle en este capítulo. 

El proceso de diseño de ubicación de polos de sistemas de contro! puede dividirse en dos fases. 
En la primera, diseñaremos el sistema suponiendo que todas las variables de estado están dispont 
bles para realimentarse. En la segunda, se diseñará el observador de estados, que estimará todas las 
variables de estado (o sólo las no medibles directamente), requeridas para realimentar, a fin de com», 
pletar el diseño. 

Observe que en el método de diseño anterior, los parámetros de diseño son las localizacio 
de los polos en lazo cerrado deseados y el período de muestreo T. (Este período T determina efect 
vamente el tiempo de asentamiento para la respuesta.) 

En el análisis de este capítulo supondremos que las perturbaciones son impulsos que se 
sentan en forma aleatoria. Su efecto es modificar el estado de sistema. Por lo tanto, una perturbacia 
puede ser representada como un estado inicial. Se supone además que el espaciamiento entre pe 
baciones adyacentes es lo suficientemente amplio, para que cualquier respuesta a dicha perturbacio 
se haya amortiguado antes de que la siguiente se presente, por lo que el sistema siempre estará li 
para la siguiente instancia. 

Aunque la preocupación de este capítulo se centrará principalmente en el problema de reg 

ción, también se analizarán problemas de control. El problema es reducir el vector de error h 
cero con suficiente velocidad. Tanto en el problema de regulación como en el de control, la formulació 
de la ubicación de polos del diseño se reduce a la determinación de la matriz de ganancia 
realimentación del estado deseada. El procedimiento para la determinación de dicha matriz del e 
do es primero elegir localizaciones adecuadas para todos los polos en lazo cerrado, y a continuach 
determinar aquella matriz de ganancia de realimentación del estado que dé como resultado 
polos en lazo cerrado especificados, de forma que los errores causados por perturbaciones o ent 
de comando puedan ser reducidos a cero con suficiente velocidad. En el estado final del proceso 
diseño la realimentación del estado se lleva a cabo mediante el uso de variables de estado estim 
mas que con variables de estado reales, mismas que probablemente no están disponibles para 
medición directa. Si algunas de las variables de estado son medibles, entonces se pueden utili 
esas variables de estado disponibles y utilizar variables de estado estimadas en vez de aq 
verdaderamente no medibles. 

En la última parte de este capítulo se tratará un problema de diseño de seguimiento, que uti 
el control integral junto con la técnica de ubicación de polos y el observador de estados. Observe 
en el problema de regulación, se desea transferir al origen el vector de error no cero (debide 
perturbación). En el problema de seguimiento, se necesita que la salida siga a la entrada de com 
Note que el sistema de seguimiento debe seguir la entrada de comando y al mismo tiempo re 
cualquier problema de regulación. Como consecuencia, en el diseño del sistema de seguimiento 
puede empezar con el diseño de un sistema de regulación y, a continuación, modificar dicho si 


y convertirlo en uno de seguimiento. 
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Resumen del capítulo. La sección 6-1 presentó una introducción al material que se va a 
¿studiar en este capítulo. La sección 6-2 analiza la controlabilidad de los sistemas de control lineales 
z invariantes en el tiempo. La sección 6-3 trata la observabilidad de dichos sistemas. La sección 6-4 
revisa transformaciones útiles en el análisis y diseño en el espacio de estados, que se usarán en las 
secciones restantes de este capítulo. El método básico de diseño en el espacio de estados se presenta 
zn las secciones 6-5 y 6-6. La sección 6-5 presenta el método de ubicación de polos, que es la 
zrimera fase del diseño. En este método se supone que todas las variables de estado pueden medirse 
+ están disponibles para realimentarse. La sección 6-6 analiza la segunda fase del diseño, el diseño 
22 los observadores de estados, que estiman las variables de estado que realmente no son medibles. 
-a estimación se basa en las mediciones de las señales de salida y de control. Las variables de estado 
¿stimadas pueden ser utilizadas para la realimentación del estado, basado en el diseño de ubicación 
ze polos. Por último, la sección 6-7 se ocupa de los sistemas de seguimiento y analiza el diseño de 
zstos sistemas; la sección concluye con un ejemplo de diseño. 


P CONTROLABILIDAD 


Se dice que un sistema de control es de estado completamente controlable, si es posible transferir el 

i sistema de un estado inicial arbitrario a cualquier estado deseado (también un estado arbitrario), en 
¿n periodo finito. Es decir, un sistema de control es controlable si todas las variables de estado 
pueden ser controladas en un período finito, mediante alguna señal de control no restringida. Si 
cualquiera de las variables de estado es independiente de la señal de control, entonces resulta impo- 
sible controlar esa variable de estado y, por lo tanto, el sistema es no controlable. 

Puede no existir solución a un problema de control óptimo, si el sistema se considera no 
controlable. Á pesar de que la mayor parte de los sistemas físicos son controlables, los modelos 
matemáticos correspondientes quizás no tengan la propiedad de controlabilidad. Por lo tanto, es 
necesario saber la condición bajo la cual el sistema es controlable. Veremos más adelante, en la 
sección 6-5, que el concepto de controlabilidad juega un papel importante en la ubicación arbitraria 
de polos en los sistemas de control. Ahora se deducirá esta condición. 


Controlabilidad completa del estado para un sistema de control en tiempo discreto lineal e 
invariante en el tiempo. Considere el sistema de control en tiempo discreto definido por 
x((k + DT) = Gx(kT) + Hu(kT) (6-1) 
donde 
x(ÁT) = vector estado (de dimensión 7) en el A-ésimo instante de muestreo 
u(kT) = señal de control en el k-ésimo instante de muestreo 
G = matriz de n x n 
H = matriz de n x 1 
T = periodo de muestreo 


Suponemos que u(A7) es constante para kT<f < (k + DT. 
El sistema de control en tiempo discreto dado por la ecuación (6-1) se dice es de estado com- 
pletamente controlable, o simplemente de estado controlable, si existe una señal de control constante 
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por intervalos u(kT) definida a lo largo de un número finito de períodos de muestreo de forma que. 
partir de cualquier estado inicial, el estado x(X7) pueda ser transferido al estado deseado x. em 
períodos de muestreo como máximo. (Al analizar la controlabilidad, el estado deseado x, 
especificarse como el origen, o x; = 0. Vea el problema A-6-1. Aquí, sin embargo, suponemos que 
es un estado arbitrario en el espacio de n dimensiones, que incluye el origen.) 

Utilizando la definición que se acaba de dar, a continuación se deducirá la condición para 
controlabilidad completa del estado. En vista de que la solución a la ecuación (6-1) es 


x(nT) = G"x(0) + S cu mul jT) 


= G"x(0) + G” Hu(0) + G"? Hu(T) + -++ + Hu((n — 1)T) 


obtenemos 
u((n — 1))T) 
x(nT) — G"x(0) = [H:GH:---:G'"H] u((n 2)T) 
u(0) 


Dado que H es una matriz de n x 1, encontramos que cada una de las matrices H, GH,...G”” Hi 
una matriz de n x 1 o un vector columna, Si el rango de la matriz siguiente es n, es decir 


i 
entonces los n vectores H, GH, ..., G””' H pueden abarcar todo el espacio de n dimensiones 
matriz 


comúnmente se conoce como matriz de controlabilidad. (Observe que todos los estados que p 
ser alcanzados desde el origen, están abarcados por las columnas de la matriz de controlabili 
Por lo tanto, si el rango de tal matriz es n, entonces, para un estado arbitrario x(17) = xy, existirá 
secuencia de señales de control no acotadas u(0), u(£), ..., u[(n — 197] que satisfaga la ec 
(6-2). Por lo tanto, la condición de que el rango de la matriz de controlabilidad sea n da una c 
ción suficiente para la controlabilidad completa del estado. 

Para probar que la ecuación (6-3) es también una condición necesaria para la controlabih 
completa del estado, se supone que 


Entonces, utilizando el teorema de Cayley-Hamilton, puede demostrarse que, para una / arbi 
G' H puede expresarse como una combinación lineal de H, GH, . . . , G”7' H. En consecu 
tenemos para cualquier ¡ 


y por lo tanto los vectores H, GH, . . . , G'7' H no pueden abarcar completamente el espacio 
dimensiones; y por lo tanto, para algunas x, no es posible tener x(17) = x, para todas las i. Ent 

es necesaria la condición dada por la ecuación (6-3). De esta manera, se encuentra que la condh 
de rango dada por la ecuación (6-3) es necesaria y suficiente para la controlabilidad compl 


estado. 
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Si el sistema definido por la ecuación (6-1) es completamente controlable de estado, enton- 
ces es posible transferir cualquier estado inicial a cualquier estado arbitrario, en a lo más n períodos 
Je muestreo. Observe, sin embargo, que esto es cierto si y sólo si la magnitud de (XT) es no aco- 
tada. Si dicha magnitud es acotada, pudiera tomar más de n períodos de muestreo. (Vea el problema 
A-6-2.) 


Controlabilidad completa del estado en el caso en que u(kT) es un vector. Siel sistema está 
definido por 
x((k + 1)T) = Gx(kT) + Hu(kT) 


donde x(A7) es un vector de dimensión n, u(k7) es un vector r, G es una matriz de n x n, y H es una 
matriz de n x r, entonces se puede probar que la condición para la controlabilidad completa del 
estado es que la matriz de n x nr 


sea de rango n, es decir 


Determinación de la secuencia de control para llevar el estado inicial a un estado deseado. Si 
la matriz 


es del rango n y u(kT) es un escalar, entonces es posible encontrar n ecuaciones escalares linealmente 
independientes, a partir de las cuales se puede determinar en forma única una secuencia de señales 
de control no acotadas u(k7X(k=0, 1,2,...,n-— 1) tal que cualquier estado inicial x(0) se transfiera 
al estado deseado en n periodos de muestreo. Vea la ecuación (6-2). 

Observe también que si la señal de control no es un escalar sino un vector, entonces la secuen- 
cia de u(kT) no es única. De esta manera existe más de una secuencia para el vector de control u(kT) 
para llevar el estado inicial x(0) a un estado deseado, en no más de n periodos de muestreo. 


Forma alterna de la condición para la controlabilidad completa del estado. Considere el 
sistema definido por 
x((k + 1)T) = Gx(KT) + Hu(kT) (6-4) 
donde 
x(kT) = vector estado (de dimensión 7) en el k-ésimo instante de muestreo 
u(kT) = señal de control en el k-ésimo instante de muestreo 
G = matriz de n x n 
H = matriz de n x r 
T = periodo de muestreo 


Si los vectores característicos de G son distintos, entonces se puede encontrar una matriz de transfor- 
mación P tal que 
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0 An 
Note que si los valores característicos de G son distintos, entonces los vectores característicos Je 
también lo son. Sin embargo, lo opuesto no es cierto. (Por ejemplo, una matriz simétrica real de œ 


n con valores característicos múltiples tiene n vectores característicos distintos.) Observe tams 
que la ¡-ésima columna de la matriz P es un vector característico de G asociado con el ¡-ésimo + 


característico À, (¿= 1,2,...,n). Se define 
x(kT) = PxX(kT) $ 


Al sustituir la ecuación (6-5) en la ecuación (6-4), se obtiene 


x((k + 1)T) = P'GPX(kT)) + P"'Hu(kT) 


Defínase 
fu fu E fir 
P Hgsf= |e o h 
fa faz Az far 


Por lo tanto, la ecuación (6-6) puede escribirse como sigue: 


£((k + 1)T) = MÍÁAKT) + fi u(kT) + foukkT) +--+ fu (kT) 
Í(k + 1)T) = MXAKT) + faul(kT) + faukkT) +--+ fo u (KT) 


Xn((k + 1)T) = An ên (KT) + fa UAT) + fi UAKT) + + faru, (KT) 


Si los elementos de cualquiera de los renglones en la matriz de F n x r son todos cero, ento 
variable de estado correspondiente no puede controlarse mediante cualquiera de los u(kP1 
tanto, la condición para la controlabilidad completa del estado es que si los vectores caract 
de G son distintos, entonces el sistema es de estado completamente controlable, si y sólo si 7a 
de los renglones de P”' H tienen elementos cero. Es importante señalar que para aplicar esta 
ción de la controlabilidad completa del estado, se debe poner la matriz P”' GP de la ecuaci 
en la forma diagonal. 

Si la matriz G en la ecuación (6-4) no tiene vectores característicos distintos, en 
imposible su diagonalización. En tal caso, podemos transformar G a una forma canónica de 
Si, por ejem plo, G tiene valores característicos À, Ay, Aj, Ay, Ags Ags - - - >) Ay y posee n- 3 
característicos distintos, entonces la forma canónica de Jordan de G es 
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[à 1 01 o] 
0O A 1l) 
0 0 A AN 
tA 1: 
E O Asl o 
de LA 0 
0 20 Ar 








L -J 


Las submatrices de 3 x 3 y de 2 x 2 sobre la diagonal principal se conocen como bloques de Jordan. 
Suponga que es posible encontrar una matriz de transformación S de modo que 


SsIGS=J 
Si definimos un nuevo vector de estado X mediante 
x(kT) = SX(kT) (6-7) 


asi. al sustituir la ecuación (6-7) en la ecuación (6-4) resulta 
x(k + DT) = SUGSKAT) + S”*Hu(kT) 
= JX(kT) + S Hu(kT) (6-8) 


Las condiciones para la controlabilidad completa del estado del sistema de la ecuación (6-8) pueden 
entonces enunciarse como sigue: el sistema es de estado completamente controlable, si y sólo si: 1) 
dos bloques de Jordan en la matriz J de la ecuación (6-8) no estén asociados con valores caracteris- 
ticos iguales; 2) los elementos de cualquier renglón de S~ H, que corresponden al último renglón de 
cada uno de los bloques de Jordan no sean todos cero, y 3) los elementos de cada renglón de S”' H, 
que correspondan a valores característicos distintos, no sean todos cero. 


Comentarios. En las condiciones precedentes de la controlabilidad del estado, se ha dicho 
que en la ecuación (6-8) no deberían estar asociados dos bloques de Jordan de la matriz J con valores 
característicos iguales. Este punto se desarrolla como sigue. 

Considere el sistema siguiente, donde los dos bloques de Jordan están asociados con los mis- 
mos valores característicos A;: 


xkl falo ow] Ti 
x(k + 1) =ų;|0 x(k) +11 u(k) 


1 
x(k +1) 0: 0 à jl xs(k) 1 


Aunque todas las variables de estado están afectadas por u(k), este sistema es no controlable, ya que 
el rango de la matriz de controlabilidad 


lo A Ai 
[H:GH:G?'H] =|1 A+1 Af +22; 
lo A A 


es 2. Por lo tanto, al aplicar el criterio anterior correspondiente a la controlabilidad de estado, ningu- 
no de los dos bloques de Jordan de J deberá estar asociado con los mismos valores característicos. 
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Ejemplo 6-1 
Los sistemas siguientes son de estado completamente controlables: 


ak +0] f-1 oax) 2 
A RETO 


x(k + 1) -2 1 0; oll x(k) | [o 1 
x(k +1) 0 -2 11 x(k) 0 0 z 

2. |x(k+1)|=]_0 0 -21 ŻŽ x(k)| +13 0 Fa 
x(k +1) sado oao tee 
xs(k + 1) 0 1 0 -5j x(k) 2 1 


Los siguientes sistemas no son de estado completamente controlables: 


resmi [1 oea Ta 
le el 0 RABAT 


arpi dez 1 0 olaa] lo al 
x(k + 1) 0 -2 1; x(k) 3 0 2 
2|ak+nl=| o 0-21 Iaw l|+lo o Ea 
alk p| |a ET] a] fa 1h 
tikt 0 o =slle() | [oo 


Condiciones para la controlabilidad completa del estado en el plano z. La condición 
la controlabilidad completa del estado puede enunciarse en términos de funciones de transfer 
pulso. 

Una condición necesaria y suficiente para la controlabilidad completa del estado es que no 
presente cancelación en la función de transferencia pulso. Si esto ocurre, el sistema no puede 
controlado en la dirección del modo cancelado. (Vea el problema A-6-4.) 


Ejemplo 6-2 

Considere la siguiente función de transferencia pulso: 

Ye) z +0.2 

U(z) (z + 0.8)(z + 0.2) 
Es claro que ocurren cancelaciones en los factores (z + 0.2) tanto en el numerador como en el dene 
dor. Por lo tanto, se pierde un grado de libertad. En razón de esta cancelación, este sistema no es de a 
completamente controlable. 

Por supuesto, se puede obtener la misma conclusión escribiendo esta función de transfer 

pulso en la forma de ecuaciones de estado. Una posible representación de espacio de estados parz 


sistema es 
x(k + 1) a 0 1 x(k) 1 
p + 7 S na E ü MATO 


y(k) = [1 ao | 





Dado que 


—0.8 0.64 


el rango de [H : GH] es 1. Llegamos por lo tanto a la misma conclusión: el sistema no es de 
completamente controlable. 


[H: GH] -| a | 
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Controlabilidad completa de la salida. En el diseño práctico de un sistema de control, se 
puede preferir controlar la salida en vez del estado del sistema. La controlabilidad completa del 
estado no es necesaria ni suficiente para controlar la salida de un sistema. Por esta razón es necesario 
definir por separado la controlabilidad completa de la salida. 

Considere el sistema definido por las ecuaciones 


x((k + 1)7) = Gx(kT) + Hu(kT) (6-9) 
y(kT) = Cx(kT) (6-10) 
Jonde 
x(kT) = vector estado (de dimensión n) en el k-ésimo instante de muestreo 
u(kT) = señal de control (escalar) en el k-ésimo instante de muestreo 
y(kT) = vector de salida (de dimensión m) en el k-ésimo instante de muestreo 
G = matriz de n x n 
H = matriz de n x 1 
C = matriz de m x n 


El sistema definido por las ecuaciones (6-9) y (6-10) se dice que es de salida completamente contro- 
lable, o simplemente de salida controlable, si es posible tener una señal de control no restringida 
u{kT), definida a lo largo de un número finito de períodos de muestreo 0 < kT < nT tales que, empe- 
zando a partir de una salida inicial y(0), la salida y(k7) pueda ser transferida al punto deseado (un 
punto arbitrario) y, en el espacio de salidas, en n períodos de muestreo como máximo. 

A continuación se deduce la condición para la controlabilidad completa de la salida. Observe 
que si un sistema es de salida completamente controlable, entonces existe una señal de control cons- 
tante unitaria, que transferirá cualquier salida inicial a cualquier punto deseado y, en el espacio de 
salidas, en n períodos de muestreo como máximo. En vista de que la solución de la ecuación (6-9) es 


x(nT) = G” x(0) + 3 G"! Hu(jT) 


tenemos que 
y(nT) = Cx(nT) 


n-1 


= CG"x(0) + È CG"! Hu(¡T) 
j=0 


es decir, 
n-1 


y(nT) — CG" x(0) = 2 CG" Hu(¡T) 


= CG" Hu(0) + CG"? Hu(T) + --- + CHu((n — 1)T) 


u((n — 1)7) 
= (CH: cGH: > ¿067 (O 7 207) 
u(0) 


FECEpLA 
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Observe que y(27) — CG” x(0) = y, - CG” x(0) representa un punto arbitrario en el espacio de 
salidas de m dimensiones. Por lo tanto, igual que en el caso de la controlabilidad completa del 
estado, una condición necesaria y suficiente para que el sistema sea de salida completamente contro- 
lable, es que los vectores GH, CGH, ..., CG”? H abarquen el espacio de salidas de dimensión m. 
es decir que 


rango [CH : CGH : +++: CG 'H]=m (6-111 
De este análisis se puede ver que en el sistema definido por las ecuaciones (6-9) y (6-10). ta 
controlabilidad completa del estado implica controlabilidad completa de la salida, si y sólo si los ø 


renglones de C son linealmente independientes. 
Ahora considere el sistema definido por las ecuaciones 


(6-1 
(6-1 


x((k + 1)T) = Gx(kT) + Hu(kT) 
y(kT) = Cx(kT) + Du(kT) 
donde 
x(kT) = vector de estado (de dimensión ») en el k-ésimo instante de muestreo 
u(kT) = vector de control (de dimensión r) en el k-ésimo instante de muestreo 
y(kT) = Vector de salida (de dimensión m) en el k-ésimo instante de muestreo 
G = matrizdenxn 
H = matriz de n x r 
C = matriz de m x n 
D = matriz de m x r 
La condición para la controlabilidad completa de la salida correspondiente a este sistema 


deducirse como sigue. Dado que la salida y(nT) puede ser dada por la ecuación 


y(nT) = Cx(nT) + Du(nT) 
= CG" x(0) + Y ce Hu(7) + Du(nT) 


se obtiene 


n~) 


y(nT) — CG" x(0) = Y CG"? Hu( jT) + Du(nT) 
j=0 


= CG” 'Hu(0) + CG"? Hu(T) + -++ + CHu((n — 1)T) 
+ Du(nT) 
u(nT) 
= [D:cH:c6H: > iceri n| Ye 7 DD 
u(0) 
Una condición necesaria y suficiente para que el sistema definido por las ecuaciones (6-12) y t 
sea de salida completamente controlable, es que la matriz de m x (n + 1)r 
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s2a de rango mm: 
rango [D: CH: CGH : +++: CG" H] =m (6-14) 
Hay que señalar que la presencia de la matriz D en la ecuación de salida del sistema siempre ayuda 


z establecer la controlabilidad completa de la salida. 


Controlabilidad de un sistema de control en tiempo continuo lineal e invariante en el 
tiempo. A continuación se enunciará brevemente las condiciones para la controlabilidad completa 
Jel estado y la controlabilidad de la salida de los sistemas de control en tiempo continuo lineales e 
invariantes con el tiempo. Considere el sistema definido por 


š = Ax + Bu 
y = Cx + Du 
Jonde 
x = vector de estado (de dimensión n) 
= vector de control (de dimensión +) 
y = vector de salida (de dimensión »») 
A = matriz de n x n 
B = matriz de n xr 
C = matriz de m x n 
D = matriz de m x r 


Controlabilidad completa del estado. Una condición necesaria y suficiente para la 
controlabilidad completa del estado para este sistema, puede deducirse en forma similar a como se 
hizo en el caso de un sistema en tiempo discreto. Aquí presentaremos sólo el resultado. 

La condición para la controlabilidad completa del estado es que la matriz de n x nr 


sea de rango n, o que contenga n vectores columna linealmente independientes, (Esta matriz por lo 
regular se conoce como matriz de controlabilidad para el sistema en tiempo continuo.) 

La condición para controlabilidad completa del estado también se puede enunciar en términos 
de las funciones de transferencia o de las matrices de transferencia. Una condición necesaria y sufi- 
ciente para la controlabilidad completa del estado es que no ocurra cancelación en la función de 
transferencia o en la matriz de transferencia. Si ocurre cancelación, el sistema no puede ser contro- 
lado en la dirección del modo cancelado. 


Controlabilidad de la salida. Como en el caso del sistema de control en tiempo discreto, la 
controlabilidad completa del estado no es necesaria ni suficiente para controlar la salida de un siste- 
ma de control en tiempo continuo lineal e invariante en el tiempo. Se puede demostrar que la condi- 
ción para la controlabilidad completa de la salida es que el rango de la matriz de m x (n + Dr 


[D:CB:CAB:CA?B:---:CA"!B] 
sea Mm. 


www.FreeLibros.me 


6-3 OBSERVABILIDAD 

















388 Ubicación de polos y diseño de observadores 


En esta sección, analizaremos la observabilidad de los sistemas de control en tiempo discr: 
e invariante con el tiempo. Considere el sistema de control en tiempo discreto sin excitación 
por 


x((k + 1)T) = Gx(kT) 
y(kT) = Cx(kT) 
donde 


x(kT) = vector de estado (de dimensión n) en el k-ésimo instante de muestreo 
y(kT) = vector de salida (de dimensión m) en el k-ésimo instante de muestreo 
G = matriz de nx n 


C = matriz de m x n 


El sistema se dice ser completamente observable si cualquier estado inicial x(0) puede det 
a partir de la observación de y(kT) sobre un número finito de periodos de muestreo. El si 
lo tanto, es completamente observable, si cualquier transición del estado de manera evenz 
a todos los elementos del vector de salida. 

El concepto de observabilidad es útil para resolver el problema de la reconstrucción 
bles de estado no medibles. Se verá más adelante que los sistemas de control con realime 
estado, diseñados mediante el método de ubicación de polos, necesitan realimentación de 
de estado ponderadas. En la práctica, sin embargo, en los sistemas de control con realime: 
estado se encuentra la dificultad de que algunas de las variables de estado no son accesit 
medición directa. Entonces requiere estimar las variables de estado no medibles, a fin de 
señales de control de realimentación. En la sección 6-6 veremos que el concepto de obs 
tiene un papel dominante en el diseño de los observadores de estados. 

La razón por la que se considera el sistema sin excitación es la siguiente. Si el sistema. 
descrito por las ecuaciones 


x((k + 1)T) = Gx(kT) + Hu(kT) 
y(kT) = Cx(kT) + Du(kT) 


entonces 
k-1 


x(kT) = G*x(0) + 3 Gi Hu( jT) 


y y(KT) es 

k-1 

y(kT) = CG*x(0) + >) CG! Hu( jT) + Du(kT) 

j=0 
Dado que las matrices G, H, C y D son conocidas, y u(k7) también lo es, el segundo y 
nos del segundo miembro de esta última ecuación son cantidades conocidas. Por lo 
restarse del valor observado de y(K7). Entonces, para la investigación de una condición 
suficiente para la observabilidad completa, basta considerar el sistema descrito por las 
(6-15) y (6-16). f 
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Una vez que a partir de la observación de la salida se pueda determinar x(0), también podrá 
determinarse x(ÁT), ya que (0), (PD), ..., u((k— 1)7) son conocidas. 


Observabilidad completa de los sistemas en tiempo discreto. Considere el sistema definido 
por las ecuaciones (6-15) y (6-16). El sistema es completamente observable si, dada la salida y(4T) 
sobre un número finito de períodos de muestreo, es posible determinar el vector estado inicial x(0). 

Ahora, deduciremos la condición para la observabilidad completa del sistema en tiempo dis- 
creto descrito por las ecuaciones (6-15) y (6-16). En vista de que la solución x(A7) de la ecuación (6- 
15) es 


x(kT) = G*x(0) 
se obtiene 
y(kT) = CG*x(0) 


La observabilidad completa significa que, dado y(0), y(7), yQ7), . . . , es posible determinar x,(0), 
x(0), ...,x,(0). Para determinar n incógnitas, necesitamos únicamente n valores de y(A7). Por lo 
tanto, podemos utilizar los primeros n valores de y(k7), o y(0), y(T7), ..., y((1— 1)7) que permiten 
determinar x,(0), xx(0), ....,x,(0). 

En el caso de un sistema completamente observable, dados 


y(0) = Cx(0) 
y(T) = CGx(0) 


y((n — 19T) = CG” x(0) 


se debe ser capaz de determinar x,(0), x.(0), . . ., x,(0). Al observar que y(xT) es un vector de 
dimensión m, las n ecuaciones simultáneas anteriores dan como resultado nm ecuaciones, todas ellas 
incluyendo x,(0), x,(0), ...,x,(0). A fin de obtener un solo conjunto de soluciones x,(0), x,(0), ..., 
x,(0) a partir de estas nm ecuaciones, se debe escribir exactamente de entre ellas n ecuaciones linea- 
les independientes. Esto requiere que la matriz nm x n 


sea de rango n. 

Notando que el rango de una matriz y de su transpuesta conjugada es el mismo, es posible 
enunciar la condición correspondiente a la observabilidad completa como sigue. Una condición 
necesaria y suficiente para que el sistema definido por las ecuaciones (6-15) y (6-16) sea completa- 
mente observable es que el rango de la matriz de n x nm 


[C*:G*C*:.--:(G*y 1 C*] (6-17) 
sea n. La matriz dada por la ecuación (6-17) se conoce comúnmente como matriz de observabilidad. 


[Note que en la ecuación (6-17) los asteriscos indican transpuestas conjugadas. Si las matrices C y G 
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son reales, entonces la notación de transposición conjugada como G*C* puede ser cambiada 
notación de transposición, como G*C”.] 


Forma alterna de la condición para la observabilidad completa. Considere el sistema 
nido por las ecuaciones (6-15) y (6-16) que aquí se repite: 


x((k + 1)T) = Gx(kT) 
y(kT) = Cx(kT) 


Suponga que los valores característicos de G son distintos, y que una matriz de transformación 
transforma a G a una matriz diagonal, de tal forma que P’ GP es una matriz diagonal. Se defme 


x(kT) = PX(kT) 
Entonces las ecuaciones (6-18) y (6-19) se pueden escribir como sigue: 
x((k + 1)T) = P GPx(kT) 
y(kT) = CPx(kT) 
Por lo tanto, 


y(nT) = CP(P"! GP) x(0) 


es decir, 
Ai 141(0) 
yan=-=c¢œ| > 20) = cp| 440) 
Ni 152,(0) 
donde A,, A», . . . , A, son n valores característicos distintos de G. El sistema es comple 


observable, si y sólo si ninguna de las columnas en la matriz CP de m x n está formada de ele 
cero. Esto es debido a que si la ¡-ésima columna de CP está formada de elementos cero, entonces. 
variable de estado x,(0) no aparecerá en la ecuación de salida y, por lo tanto, no podrá ser det 
nada a partir de la observación de y(XT). Por lo tanto, x(0), que está relacionada con X(0) medi 
la matriz no singular P, no podrá ser determinada. 

Si la matriz G implica valores característicos múltiples y no puede ser transformada a : 
matriz diagonal, entonces si se utiliza una matriz de transformación adecuada S podemos 
mar G a la forma canónica de Jordan: 


Ss GS =J 
donde J está en la forma canónica de Jordan. Definamos 
x(kT) = Sx(kT) 
Entonces las ecuaciones (6-18) y (6-19) se pueden escribir como sigue: 
xX((k + 1)T) = S GSR(kT) = IX(KT) 
y(kT) = CSX(kT) 
Por lo tanto, 


y(nT) = CS(S”! GS)"X(0) 
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El sistema es completamente observable, si y sólo si 1) dos bloques de Jordan en J no están asocia- 
dos con el mismo valor característico; 2) ninguna de las columnas de CS que corresponda al primer 
renglón del bloque de Jordan está formada de elementos cero, y 3) ninguna columna de CS que 
corresponda a valores característicos distintos está formada de elementos cero. 

Para aclarar la condición 2, en el ejemplo 6-3 que se muestra a continuación, se han señalado 
con líneas punteadas las columnas de CS que corresponden al primer renglón de cada bloque Jordan. 


Ejemplo 6-3 
Los sistemas siguientes son completamente observables: 


akr] 1 Olarr) E (ET) 
L alal 0 Ol EN En] 


x((k + 197) 21 0! 0 || x,(47) 
x(k + 1)T) 02 1! xÁkT) 

2. |x((k + 1D) |=|0 0 2: xa(kT) 
xd(k + 197) ] 77777 TET |] xk T) 
xs((k + 1)T) 0 1.0 -3|| xs(kT) 
sa 

en]. [i 1170 2] (ET) 

pen iO 1 1 ¿40 (ET) 

xs(kT) 


Los sistemas siguientes no son completamente observables: 


«e+om]_f-1 ofan]. _ KT) 
E no El 0 Hee ns dl 


xa((k + 1)T) 210 0 xa(kT) 
x(k + 1)T) 0 2 1 x(kT) 
2. |xx((k + 1)7)|=|0 0 2 xx(kT) 


xd (k + DDD | E 307 T || xa(kT) 


3 
xs((k + 1)T) 0 0 -3 || xs(kT) 
x(kT) 
nan) [a 1 0 lees 
eae 1 10] o] E 
xs(kT) 


Condición para la observabilidad completa en el planoz. La condición para la observabilidad 
completa también puede enunciarse en términos de funciones de transferencia pulso. Una condición 
necesaria y suficiente para la observabilidad completa es que no ocurra ninguna cancelación de 
polos ceros en la función de transferencia pulso. Si ocurre cancelación, el modo cancelado no podrá 
observarse en la salida. 


Ejemplo 6-4 
Demuestre que el sistema siguiente es no completamente observable: 
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es de estado completamente controlable y completamente observable. (Vea el problema A-6-4.) Es 
significa que una función de transferencia cancelada no lleva consigo toda la información que carac 
teriza al sistema dinámico. 


observabilidad. Considere el sistema S, definido por las ecuaciones 














Ubicación de polos y diseño de observadores Capitulo € 
x((k + 197) = Gx(kT) + Hu(kT) 
y (KT) = Cx(kT) 
donde 
0 1 0 0 
G=| 0 0 ij, H=}ļ]0j, C=(4 5 1] 
-6 -11 -6 1 


Es claro que la señal de control u(k7) no afecta la observabilidad completa del sistema. Para examinar la 
observabilidad completa, podemos simplemente definir u(kT) = 0. Para este sistema, tenemos 


4 -—6 6 
[C*:G*C*:(G*)C*] =|5 -7 5 
1 -1 -1 
Note que 
4 -6 6 
5 =1 S|=0 
Lo HL. =l 








Por lo tanto, el rango de la matriz [C* : G*C* : (G*y C*] es menor de 3. El sistema no es completamez- 
te observable, 

De hecho, en este sistema ocurre cancelación de polos ceros en la función de transferencia pulso 
del sistema. La función de transferencia pulso entre X,(z) y U(z) es 


AG) A MA 
U(z) (+ DG + 2)G +3) 
y la función de transferencia pulso entre Y(z) y X|(z) es 
Y(2) 
X(z) 


Por lo tanto, la función de transferencia pulso entre la salida Y(z) y la entrada U(z) es 


= (2 + 1)(z + 4) 


Yz) 4+DG6+4) 

U(z) (+ 1DG +2) +3) 
Es claro que se cancelan los factores (z + 1) en el numerador y en el denominador. Esto significa que 
existen estados iniciales diferentes de cero x(0) que no pueden ser determinados a partir de la medición: 
de y(kT). 





Comentarios. La función de transferencia pulso no tiene cancelación, si y sólo si, el siste 


Principio de dualidad, A continuación se examinará la relación entre controlabilidad 


x((k + 1)T) = Gx(kT) + Hu(kT) (6-2 
y(kT) = Cx(kT) (6-21 
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zonde 
x(kT) = vector de estado (de dimensión 7) en el k-ésimo instante de muestreo 
u(xT) = vector de control (de dimensión r) en el k-ésimo instante de muestreo 
y(KkT) = vector de salida (de dimensión m) en el k-ésimo instante de muestreo 
G = matriz de n x n 
H = matriz de n x r 


C = matriz de m x n 


~ su contraparte dual, que llamaremos sistema S,, definida por las ecuaciones 
X((k + 1)T) = GX(kT) + C*úu(kT) (6-22) 
CKT) = H*x(kT) (6-23) 


zonde 
(ÁT) = vector de estado (de dimensión n) en el k-ésimo instante de muestreo 
u(xT) = vector de control (de dimensión r) en el k-ésimo instante de muestreo 
Y(AT) = vector de salida (de dimensión m) en el k-ésimo instante de muestreo 
G* = transpuesta conjugada de G 
H* = transpuesta conjugada de H 
C* = transpuesta conjugada de C 
Ahora se examinará una analogía entre controlabilidad y observabilidad. Esta analogía se conoce 
como principio de dualidad, y es debida a Kalman. 
El principio de dualidad dice que el sistema S, definido por las ecuaciones (6-20) y (6-21) es 
je estado completamente controlable (observable), si y sólo si el sistema S, definido por las ecuaciones 
6-22) y (6-23) es de estado completamente observable (controlable). Para verificar este principio, 
escribamos las condiciones necesarias y suficientes para la controlabilidad completa y la observabilidad 
completa del estado, correspondientes a los sistemas S, y S,, respectivamente. 


ARA EL SISTEMA S4: 


1. Una condición necesaria y suficiente para la controlabilidad completa del estado es que 


SARA EL SISTEMA S3: 
1. Una condición necesaria y suficiente para la controlabilidad completa del estado es que 


rango [C* : G*C* +++: (G*)/!C*]=n 
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2. Una condición necesaria y suficiente para la observabilidad completa es que 
rango [H: GH: -*-+:G”'H]=5» 
Si se comparan estas condiciones, es evidente la verdad del principio de dualidad. 


Vemos que el sistema S,, siendo de estado completamente controlable, equivale al siste 
completamente observable. Y el sistema S,, siendo completamente observable, es equival 
sistema S, de estado completamente controlable. Mediante la utilización de este principio, la observ 
de un sistema dado puede verificarse al probar la controlabilidad del estado de su dual. 


Observabilidad completa de los sistemas de control en tiempo continuo lineales e invari 
con el tiempo. Por último, enunciaremos brevemente la condición de observabilidad co 
correspondiente al sistema de control en tiempo continuo lineal e invariante en el tiempo. El st 
se dice completamente observable, si todos los estados iniciales x(0) pueden determinarse a p 
la observación de y(t£) durante un intervalo de tiempo finito. Similar al caso del sistema de con 
tiempo discreto, necesitamos considerar sólo un sistema sin excitación. Considere el sistema 


do por las ecuaciones 


x= Ax 
y = Cx 
donde 
x = vector de estado (de dimensión n) 
y = vector de salida (de dimensión m) 


A = matriz de n x n 
C = matriz de m x n 


Igual que en el caso de sistema de control en tiempo discreto, se puede decir que la condición 
observabilidad completa es que el rango de la matriz de n x nm 


sea n. (Esta matriz de n x nm se conoce comúnmente como matriz de observabilidad del sist 
tiempo continuo.) 


Efecto de la discretización de un sistema de control de tiempo continuo so 
controlabilidad y la observabilidad. Cuando se discretiza un sistema de control en tiempo 
nuo con polos complejos, la introducción del muestreo puede dificultar la controlabilidad 
observabilidad del sistema discretizado resultante. Es decir, puede ocurrir cancelación de 
ros al pasar del caso en tiempo continuo al caso en tiempo discreto. Por lo tanto, el sistema disc 
puede perder controlabilidad y observabilidad. 

Puede demostrarse que un sistema que sea de estado completamente controlable y coi 
mente observable, en ausencia de muestreo, permanece en tales condiciones después de la in 
ción del muestreo, si sólo si para cada valor característico de la ecuación característica 


sistema de control en tiempo continuo, la relación 


WWW. Fritos. AS A 
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implica que > 
Im (A; — A) + Ea (6-25) 
donde T es el período de muestreo y n = +1, +2,.... Se hace notar que, a menos que el sistema 


contenga polos complejos, no ocurrirá cancelación de polos ceros al pasar de tiempo continuo al 
caso de tiempo discreto. 


Ejemplo 6-5 
Considere el siguiente sistema de control en tiempo continuo: 


ARO HHH: c 
y =[1 ofz] (6-27) 


Este sistema es de estado completamente controlable y completamente observable. ya que el rango de la 
matriz de controlabilidad 
A 0 1 
B: AB] = 
[ ] | 1 J 


is 2 and the rank of the observability matrix 
j 1 0 
C*; A*C*] = 
también es 2. Observe que los valores característicos de la matriz de estado son 
À = j > Àz = =j 


El sistema de control en tiempo discreto obtenido al discretizar el sistema de control en tiempo 
continuo definido por las ecuaciones (6-26) y (6-27) puede darse como sigue: 


x((k + 197) | _ T TU (kT 1 — cos T 
00] [atra a 629 


E x (kT) 
donde F es el periodo de muestreo. 
Demostraremos que el sistema discretizado dado por las ecuaciones (6-28) y (6-29) es de estado 
completamente controlable y completamente observable, si y sólo si 


Im(a A) =1+ 1427 


es decir, 
Tinr, n=1,2,3,... 


Para el sistema de control en tiempo discreto obtenido al diseretizar el sistema de control en 
tiempo continuo, tenemos la siguiente matriz de controlabilidad 


; _|1=cosT cosT +1- 2 cos T 
[H: GH] = | sen T -sen T + 2cosT a 


Observe que el rango de [H : GH] es 2 si y sólo si 72 arn (donde » = 1. 2.3... . ). También el rango de 
la matriz de observabilidad 
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1 cosT 
0 senT 


[C*:G*C*] = | 
es 2 si y sólo si T 2 n7 (donde n=1,2,3,...). 
Del análisis anterior, podemos concluir que el sistema discretizado es de estado completamen:2z 
controlable y completamente observable si y sólo si T > nm, donde n=1,2,3,.... 
Observe que siempre es posible evitar la pérdida de controlabilidad y de observabilidad escogier- 
do un período de muestreo T distinto a nm. 


6-4 TRANSFORMACIONES ÚTILES EN EL ANÁLISIS 
Y DISEÑO EN EL ESPACIO DE ESTADOS 


En esta sección primero se verán técnicas para transformar ecuaciones en el espacio de estados en 
formas canónicas. A continuación se revisará la propiedad de invariancia de las condiciones de 
rango para la matriz de controlabilidad y la de observabilidad. 


Cómo transformar en formas canónicas las ecuaciones en el espacio de estados. Considere 
la ecuación de estado en tiempo discreto y la ecuación de salida 


x(k + 1) = Gx(k) + Hu(k) (6-3 
y(k) = Cx(k) + Du(k) (6-31 


Ahora se estudiarán técnicas para transformar las ecuaciones en el espacio de estados definidas par 
las ecuaciones (6-30) y (6-31) en las tres formas canónicas siguientes: 


1. Forma canónica controlable 
2. Forma canónica observable 
3. Forma canónica diagonal o de Jordan 


(Observe que la forma canónica diagonal es un caso especial de la forma canónica de Jordan.) 
supone que el sistema definido por las ecuaciones (6-30) y (6-31) es de estado completamente c 
trolable y completamente observable. 


Forma canónica controlable, El sistema definido por las ecuaciones (6-30) y (6-31) se p 
de transformar a una forma canónica controlable, mediante la matriz de transformación 


T= MW (6-32 
donde 
M = [H:GH:---:G"'H] (6-33 
y 
An-1  An-2 a 1 
An-2 An-3 1 0 
w=| io: NE y 
a; 1 0 0 (6-3 
1 0 0 0 
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Los elementos a, mostrados en la matriz w son coeficientes de la ecuación característica 
lzZl—- G| = z" + az"! +- +anız+a, =0 


Puede demostrarse que 
TGT = (MW) *G(MW) = WM” GMW 


0 1 0 ©. 0 
0 0 1 .. 0 
=| : ; i (6-35) 
0% 0 r ade 
Tan Tn Tp +++ aI 
y 
0 
0 
T'H=|: (6-36) 
0 
1 


(Para los detalles de la deducción de las dos ecuaciones anteriores, vea los problemas A-6-5 y A-6- 


6.) 
Ahora definamos 


x(k) = TX(k) 


donde la matriz de transformación T está dada por la ecuación (6-32). Entonces las ecuaciones (6- 
30) y (6-31) se convierten en 


(k + 1) = T GTx(k) + T Hu(k) = Gx(k) + Mu(k) 
y(k) = CTK(k) + Du(k) = Cx(k) + Du(k) 
donde G = T” GT, Ĥ = T” H, Ĉ = CT, y Ô = D, es decir 


LK +1) 0 1 0 = 0 71%) 0 

i(k +1) 0 0 1o 0 | A 0 
Eoo efi o S e a 

La (k +1) o 0 o «slo! lo 
Xa(k + 1) üy “da “Ana +++ ail Xn(k) 1 

(6-37) 
i(k) 

yea ba aa n Se D 

Xn(k) 

(6-38) 


Aquí las b, son los coeficientes que aparecen en el numerador de la función de transferencia pulso 
siguiente: 
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C(zI - G)'H + D = Ĉ(zI - Ĝ)' Ê + Ô 
bo + biz™! +--+ noz +b, (6-3 
z” + az! + -ee + ana +a 
Observe que D = D= bo. El sistema dado por las ecuaciones (6-37) y (6-38) está en una fi 


canónica controlable. 


Forma canónica observable. El sistema definido por las ecuaciones (6-30) y (6-31) p 
ser transformado a una forma canónica observable, mediante la matriz de transformación 


Q = (WN*)"! 
donde 
N = [C*:G*C*:.--:(G*)"71C*] ( 
y W está dado por la ecuación (6-34). Puede demostrarse que 
0 0 --- 0 —a 
Ñ 1 0 +++ 0 ~an 
QU 'GQ=G=|0 1 --- O —a,2 
0 0 e 1 ze 
b,n z a, bo 
Q`H = Î = Br-1 a! bo 
bi Ea bo 
X 
cQ=C=[0 0 --- 0 1] 


donde las b, son los coeficientes que aparecen en el numerador de la función de transferencia 
pulso, dada por la ecuación (6-39). (Para detalles de la deducción de las ecuaciones anteriores. 
los problemas A-6-8 y A-6-9.) Entonces, al definir 


x(k) = Qx(k) 
Las ecuaciones (6-30) y (6-31) se convierten en 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) + Du(k) 


es decir, 
2(x+1)] foo. 0 -a, ]| %,(x) b, — ado 
XA + 1) 10- 0 —ân-1 (k) Ba-1 = An-1 bo 
: =|: : po : |+ : u(k) ( 
Xn-(k + 1) 00---0 — XK) b, sE a bo 
„(k E 1) 00- 1 -a £n(k) bi — A bo 
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f(k) 
f(k) 
y(k)=[0 0 --- 0 1] : |+ Dulk) (6-42) 
£n-1(k) 
4n(k) 


El sistema definido por las ecuaciones (6-41) y (6-42) está en una forma canónica observable. 


Forma canónica diagonal o de Jordan. Si los valores característicos p, de la matriz G son 


distintos, entonces los vectores característicos correspondientes £,, £,, ..., €, también son distintos. 
Defina la matriz de transformación P como sigue: 
P= [gigi ig] 
Er Then 
Pi 0 0 
pPUGpP=|0 P E 
OS 
P: Thus, if we define 
x(k) = Pí(k) 
se tieene que las ecuaciones (6-30) y (6-31) pueden estar dadas por las ecuaciones 
X(k + 1) = Gx(k) + Mu(k) (6-43) 
y(k) = Cx(k) + Du(k) (6-44) 


donde G = P“ GP, Å =P” H, C =CP y Ô =D. Por lo tanto, las ecuaciones (6-43) y (6-44) pueden 
ser escritas como 


A(k+D07 Tp 0 oTa] Ta 
EDO p e OJEE] |a lagy (6-45) 
ilk+D) lo 0o pili] La, 
£:(k) 
O= [B B o BAPE |+ Dut) (6-46) 
£,(k) 


donde las a, y las B, son constantes, tales que a, 8, es el residuo en el polo z = p; es decir, tal que aa, 
aparecerán en el numerador del término 1/(z — p,) cuando se expande la función de transferencia de 
pulso en fracciones parciales como sigue: 


C(zI - G)'H + D = Ĉ(zI - ÔĜ)' Â + D 


-8b b y.. r -+D (6-47) 
ZP, 2—P2 Luz 
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En muchos casos escogemos a, = a, =+ +° = a, = 1. [Observe que la condición necesaria y sufici 
para que el sistema sea de estado completamente controlable es que a,20(¿=m,m+1l,...,n),y 
la condición correspondiente para que sea completamente observable, es que B,>0 (¡= 1, m- 1 
+2,...,M).] 

Si existen varios valores característicos p, de la matriz G, entonces escogemos la matriz 
transformación S definida como sigue: 


donde las n, son vectores característicos (que corresponden a valores característicos distint 
vectores característicos generalizados (que corresponden a valores característicos múltiples). í 
mayor detalle sobre vectores característicos generalizados, vea el apéndice A.) Entonces 


S~ GS = matriz en la forma canónica de Jordan 


Ahora si definimos 


x(k) = Sí(k) 


entonces se pueden dar las ecuaciones (6-30) y (6-31) como sigue: 


K(k + 1) = Gx(k) + Mu(k) 
y(k) = Cx(k) + Dú(k) 


donde G = S“ GS, H = S” H, Ĉ = CS y D =D. Si, por ejemplo, la matriz G incluye un 
característico p, múltiple de orden m y otros valores característicos P,, + 1, Pm+2 - + -> Pn Siendo 
ellos distintos y diferentes de p, y, además, si el rango de p, I — G es n — 1 (lo que implica 
polinomio mínimo es idéntico al polinomio característico), entonces las ecuaciones en el esp 
estados en la forma canónica de Jordan serán: 











2(k +1) p 1 | £k) 0 
; Sg i i 
Amt + 1) j=j 0 pi! An) | +| am ulk) 
imak D (Pma O O Ena) am 
lsa+b] lo 0 Li) a, 
$ 
Xi(k) 
y(k) =[B B :: Ba) py + Du(k) i 
Ín(k) 


donde las œ, y las 8, son constantes, que aparecen en la función de transferencia de pulso de 
sistema: www.FreeLibros.me 
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C(zI - G)"H+D = Ĉ(zI - Ĝ)' Â + D 


pe Qm Bı Cm B Am Bm 
= A N RT E + ——= 
(2 — pr) (z — pı) z= pi 
+ Qm+Bm+1 +-+ nbr +D 
Ln Pm+1 e = Pn 
En muchos casos escogemos a,, = A, +1 == a, = 1. [Observe que la condición necesaria y 
suficiente para que el sistema sea de estado completamente controlable, es que a; 2 0 (¿= m, m+ 1, 
. - ., A), y para que sea completamente observable, es que B,>0(1=1,m+1,m+2,...,n).] 


Observe que si el rango de p, I — G es n- s (siendo 2 < s < n), es decir, si el polinomio mínimo 
es de un grado s — | menor que el del polinomio característico, entonces S~! GS tendrá una forma 
canónica de Jordan distinta. (Para detalles, véase el apéndice A.) 


Propiedad de invariancia de las condiciones de rango para la matriz de controlabilidad y 
para la matriz de observabilidad. Considere sistemas relacionados por transformaciones de simi- 
litud. Definamos la matriz de controlabilidad como M: 


Sea P (una matriz arbitraria n x n no singular) una matriz de transformación de similitud y 
P'"GP=G, PUH=M5 
Entonces 
P GP = P'GPP~'GP = GG = G? 
PG*P = P-'GPP~'GPP-' GP =G' 


po! Gr! P= Gr! 
Por lo tanto, 


Dado que la matriz P es no singular, 
rank M = rank M 


Similarmente, en el caso de la matriz de observabilidad se define 
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Entonces 
P*N = P*[C* 3 G*C*!-- +3 (G*)1C*] 
= [P*C* : P*G*C*:... : PGR) c*] 
= [Č* : (P` GP)*C*: ii (pr GU! P)*Č*] 
=> [Č* : G*C* puesi (G*y Č*] =Ñ 
Por lo tanto, 


rango N = rango Ñ 


6-5 DISEÑO VÍA UBICACIÓN DE POLOS 



















En esta sección se presentará un método de diseño comúnmente conocido como técnica de ubica- 
ción de polos o de asignación de polos. Supondremos que todas las variables de estado son medibles 
y disponibles para la realimentación. Se podrá demostrar que si el sistema considerado es de estada 
completamente controlable, entonces los polos del sistema en lazo cerrado pueden ubicarse en cual- 
quier localización deseada, mediante una realimentación del estado a través de una matriz de ganan- 
cia de realimentación del estado apropiada. 

La presente técnica de diseño empieza con una determinación de los polos en lazo cerrado desea- 
dos, basados en los requisitos de respuesta transitoria y/o respuesta en frecuencia como velocidad. 
factor de amortiguamiento relativo o ancho de banda. Una vez hechas estas consideraciones, suponga 
que decidimos que los polos en lazo cerrado deseados deben estar en z = 4,2 = pM,,...,2= u, (En 
la selección del período de muestreo, debe tenerse cuidado de que el sistema deseado no requiera 
señales de control excesivamente grandes. De lo contrario, ocurrirán fenómenos de saturación en el 
sistema. Si éste entra en saturación, se volverá no lineal, por lo que tal método de diseño ya no será 
aplicable, en vista de que solamente lo es para sistemas lineales e invariantes en el tiempo.) Enton- 
ces, al seleccionar una matriz de ganancia apropiada para la realimentación del estado, es posible 
obligar al sistema a tener los polos en lazo cerrado en las posiciones deseadas, siempre y cuando el 
sistema original sea de estado completamente controlable. 

A continuación, se tratará el caso en que la señal de control es un escalar y se probará que una 
condición necesaria y suficiente para que los polos puedan ser ubicados en localizaciones cuales- 
quiera arbitrarias en el plano z, es que el sistema sea de estado completamente controlable. Después 
analizaremos algunos métodos para determinar la matriz de ganancia de realimentación de estado 
requerida. 


Condición necesaria y suficiente para la ubicación arbitraria de los polos. Considere el 
sistema de control en lazo abierto que se muestra en la figura 6-1a). La ecuación de estado es 


x(k + 1) = Gx(k) + Hu(k) (6-5 
donde 


x(k) = vector de estado (de dimensión n) en el k-ésimo instante de muestreo 


u(k) = señal de control (escalar) en el k-ésimo instante de muestreo 
G  =matrizdenxmn 
H  =matrizden=x l 
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x(k +1) 





(a) 





(b) 


Figura 6-1 (a) Sistema de control en lazo abierto; (b) sistema de control en lazo cerrado 
con u(k) = —Kx(K). 


Suponemos que la magnitud de la señal de control u(k) no está acotada. Si la señal de control u(k) 
fuera 


u(k) = —Kx(k) 


donde K es la matriz de ganancia de realimentación del estado (una matriz de 1 x n), entonces el 
sistema se convierte en un sistema de control en lazo cerrado, como el que se muestra en la figura 6- 
1b), y su ecuación de estado 


x(k + 1) = (G — HK)x(k) (6-51) 


Observe que la matriz K se escoge de tal forma que los valores característicos de G — HK sean los 
polos en lazo cerrado deseados: 4,, >, ..., Mp: 

Probaremos ahora que una condición necesaria y suficiente para la ubicación arbitraria de los 
polos, es que el sistema sea de estado completamente controlable. Primero se deducirá la condición 
necesaria. Empezaremos por demostrar que si el sistema no es de estado completamente controlable, 
entonces existen valores característicos de G — HK que no pueden ser controlados por realimentación 
del estado. 
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Suponga que el sistema de la ecuación (6-50) no es de estado completamente controlab 

Entonces el rango de la matriz de controlabilidad es menor que n, es decir, 
rango [H: GH :+**:G7'H]=g<n (6-3 


Esto significa que en la matriz de controlabilidad hay q vectores columna linealmente independ; 
tes. Definamos estos q vectores columna linealmente independientes como f}, f,, . . . , f,. Asimis 
escojamos » — q vectores n adicionales V, 4 i, V¿+2) -< - , Yp tales que 


tiene rango n. Utilizando la matriz P como la matriz de transformación, definamos 


PIGP=G, P"UH=MÁ 


Entonces 
GP = PG 

es decir, 

[Gf +++ i GE | Gvasi 000: Gva] = [Ef Visas v, ]G (6- 
Y también, 

H = PÅ = [fii fi i f i Vg oi JH (6-5 

En vista de que tenemos q vectores columna linealmente independientes f,, f,, . . . , f,, pode 
utilizar el teorema Cayley-Hamilton para expresar las matrices Gf,, Gf}, . . . , Gf, en términos 


estos q vectores, Es decir, 
Gf, = gufi + gab +: + gafa 


Gf: = gnfi + gnf + t + gaf 


Gf, = guf + 824 b + ...+ gaq Ly 


Por lo tanto. la ecuación (6-53) puede escribirse como sigue: 





[gn Eu t gu 819+1 Eig >t Bu | 
ga 82 `t 8 | E2q+1 B2q+2 >'t Ex | 
8n En Baa | Baari Bag Em 

=Íf.:...: f: vpete’: AS T EN ESA ARE AO 
[ 1 q: Ygr1 v ] 0 0 0 ¡Berta Qartar y PO 
Para simplificar la notación, definamos i 0 0 dan 0 Engil da Em 
8 £2 t Eu 
8n ER *** E9 | G 
8n En ` É9 
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81gr1 81g+2 °t Ein 
S2q+1 E2q+2 *** En] Gs 
899+1 899+2 ida Ban 
00 0 
po: : | = Gu = (n— q) X q matriz cero 
0 0 .. 0 
8g+1g+1 8q+1q+2 PT atin 
Eg+2q+1 89+2q+2 tape Eg+2n = Ga 


Enq+1 Enq+2 pe Bnn 


Entonces, la ecuación (6-53) puede escribirse como sigue: 


Gf: --- Gf: Pi = jf: : z.. iy Su: Gr 
[Gf, ¿Gf, | Gv; 1:00 *¿Gv,] = [f : fo: Var va] r 
0 | Gz 
Por lo tanto, 
A Gu i Sr] 
G = | 6-55 
| i Gz ean 
A continuación, refiriéndonos a la ecuación (6-54), 
H= [iibi Liv, iv, JA (6-56) 
Volviendo a la ecuación (6-52), observe que el vector H puede escribirse en términos de q vectores 
columna linealmente independientes f,, f,, . . . , f}. Por lo tanto, 
H = hifi + haf +e + haf, 
En consecuencia, la ecuación (6-56) se puede escribir como sigue: 
hii 
hz 
hafi + ha fz +e + haf, = (A RA An 
0 
0 
Por lo tanto, 
A — Hı 
H= El (6-57) 
donde, 
hr 
MH, = has 
ha 
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Ahora considere la ecuación del sistema en lazo cerrado dada en la ecuación (6-51). La ecuación 
característica es 


zI- G +HK|=0 


Definase 
K = KP 
y divídase la matriz K para obtener 
K = [Ku :K;,] (6-581 
Si multiplicamos las ecuaciones anteriores, en orden por a, 4%, y, . . . , Ay (donde œ, = 1), respectiva- 


mente, y se suman los resultados, se suman 
K = P` = [K,:K.]P"' 
Entonces, la ecuación caracteristica para el sistema en lazo cerrado será: 
|zI — G + HK] = |P™||zI — G + HK| |P 
= |zI — PGP + P HKP] 
= [1 — G + ĤŘ| 
Sustituyendo las ecuaciones (6-55), (6-57) y (6-58) en esta última, obtenemos 


Li 0 ]|_|Gu! Gz] _ [Ha ; 
graS | 0 E úl [Tekni] 


zi, — Gu + Hu Ki l -Grn + Hı Kz 


IzI — G + BK] 


i 











La ecuación (6-59) muestra que la matriz K = P” tiene control sobre los q valores característicos 
G,, - H,, K,,, pero no sobre los n — q valores característicos de G,,. Es decir, existen n — q valo 
característicos de G — HK que no dependen de la matriz K. Por lo tanto, hemos demostrado que 
controlabilidad completa del estado es una condición necesaria para el control de todos los valo 
característicos (localizaciones de polos en lazo cerrado) de la matriz G — HK. 

Ahora se deducirá una condición suficiente. Probaremos que si el sistema es de estado c 
pletamente controlable, existe una matriz K que hará los valores característicos de G — HK como 
desean, o ubicará los polos en lazo cerrado en las posiciones deseadas. 

Los valores característicos deseados de G — HK son u,, 4», . . . , Ma, cualesquiera valo 
característicos complejos deben presentarse como pares conjugados. Si observamos que la ecuaciá 
característica del sistema original dado por la ecuación (6-50) es 


[zI — G| = z" + a z™'! + az"? + -+t + apaza =O 
puede definirse una matriz de transformación T como sigue: 
T = MW 
donde 


M = [H: GH: ---: G"'H] (6 
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que es de rango n, y donde 


An-1 Bn coo A 1 
an-2 an3 >> 1 0 
W=| : ; E 
Ñ 3 A 6-61 
a; 1 IA 0 0 ( ) 
1 0 >. 00 
Luego, de las ecuaciones (6-35) y (6-36), se tiene 
0 1 0 -= 0 
a 0 0 1 ©. 0 
TIGT=G=|: ; : > 
0 0 0 1 
— Un —An-1 —ân-2 s.e 41 
y 
0 
: 0 
T'H=H-=j|: 
0 
1 
A continuación se define 
K=KT= [S Bn ==. 8) (6-62) 
Entonces 
0 0 0 0 
a 0 0 0 0 
HK == : [S, 9-1 jas 81] == : : 
0 0 0 0 
1 0, 9-1 ôi 
La ecuación característica |z[ — G + HK] se convierte en 
Izl — G + HK] = |zI - G + K] 
10+- 0 0 1 -< 0 0 0 0 
0.1 --- 0 0 0 <- 0 0 0 0 
=ļzļ: : E | : 
0.0 --- 0 0 0 +... 1 0 0 0 
0 0 DERAT 1 4, —4An-1 4; ô, Ón-1 ĉi 
z -1 0 
0 Z 0 
0 U w A 
ân + Ôn An- og 8-1 o. a a; + ô; 
=z" + (a + 8) +---+(8, + 8,1) +a,+8,=0 (6-63) 
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La ecuación característica, con los valores característicos deseados, está dada por 


(z — m)(z — M2): (2 — un) 
=z" +02 + 02?+++0.-12+0,=0 (6-64 


Igualando los coeficientes de potencias iguales de z correspondientes a las ecuaciones (6-63) w 


(6-64), obtenemos 
a =a + ô 


0% = m + ô 


Qn = 4, + Ôn 
Por lo tanto, de la ecuación (6-62), 


K = KT"! 
= [ôn Ôn o 8,]T”* 
= [an — api 0-1 = Gp: +10 ay]JT* ( 


donde las a, y las a, son coeficientes conocidos, y T es una matriz conocida. De modo que he 
determinado la matriz de ganancia de realimentación K requerida, en función de coeficientes c 
cidos y de una matriz conocida del sistema. Esto prueba la condición de suficiencia; es decir. si 
sistema definido por la ecuación (6-50) es de estado completamente controlable, entonces sie 
será posible determinar la matriz de ganancia de realimentación del estado K, requerida para 
ubicación arbitraria de los polos. Por lo tanto, hemos demostrado que una condición necesarta 
suficiente para la ubicación arbitraria de los polos es que el sistema sea de estado completa 


controlable. 


Fórmula de Ackermann. La expresión dada en la ecuación (6-65) no es la única utilizada 
la determinación de la matriz de ganancia de realimentación del estado K. Existen otras expresi 
disponibles. A continuación presentaremos una de ellas, comúnmente conocida como fórmula 
Ackermann. 

Considere el sistema definido por la ecuación (6-50). Se supone que el sistema es de e 
completamente controlable. Mediante el uso de la realimentación del estado u(k) = —-Kx(k), se 
ubicar los polos en lazo cerrado en z = 4,,2= H», . . ., Z = My. Es decir, deseamos que la ecu 


característica sea 
zI — G + HK| = (z — 1) — 2) :>: (2 — pm) 
=z" +02 +02 ++ t aaz +a =O 
Sea 
G=G-HK 


En vista de que el teorema de Cayley-Hamilton indica que G satisface su propia ecuación cara 
tica, tenemos que 


GC +06 + aG? + oo + anG + 0.1 = $(G) =0 


Utilizaremos esta última ecuación para deducir la fórmula de Ackermann. 
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Considere ahora las siguientes identidades: 


I =1 
G =G- HK 

Č = (G - HK} = G? — GHK - HKG 

G? = (G —- HK) = G? - G'HK - GHKG - HKG? 


G” = (G — HK)” = G” - G™' HK - --- - HKĜ™! 
1 11 +.» A (donde œ = 1), respectiva- 


Si multiplicamos las ecuaciones anteriores, en orden por a,, æ 
mente, y se suma los resultados, la misma 


anl + an Ġ + an2 6? +. += ani + 0,-¡G + 0,-, G? 


+++ G” ~ ani HK — a, ¿GHK — an- HKG — -~ GHK — 
— HKG"” 
puede escribirse como 
(6) = $(G) — an-ı HK — a, -¿GHK — a,-,HKG — ++: - HKG” —- G”! HK 
a K + œn- KG +- + KG! 
= $(G) - [H:GH; i GH] PK t KG ++ + KG"? (6-66) 
K 
Observe que 
(G) =0 
Por lo tanto, la ecuación (6-66) puede modificarse a la forma 
@n-ıK + 0%, -2 KG + «+ KG"! 
$(G) = [Hi GH; ¡Gui a K + 0 KG +- + KG"? 
K (6-67) 


Como el sistema es de estado completamente controlable, la matriz de controlabilidad 


tiene rango n, y su inversa existe. Por tanto, la ecuación (6-67) puede modificarse a la forma 


æn- K + an2 KG Peb KG"" 

Qn- K + KC +- + KG"? E 
K 

i 1], obtenemos 


Premultiplicando ambos miembros de esta última ecuación por [0 0---0 
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an-ı K + an- KG +e + KG"! 
K 
=[0 0 --- 0 1][H:GH:---:G”'H]'4(G) 
que se puede simplificar a 
K=[0 0 -> 0 1][H:GH:---:G" *H] (G) (6- 


La ecuación (6-68) proporciona la matriz de ganancia de realimentación del estado K requerida. 
esta expresión en particular para la matriz K, la que comúnmente se conoce como fórmula 
Ackermann. [Vea el problema A-6-12 para la deducción de la ecuación (6-68), cuando n = 3.] 


Comentarios. La matriz de ganancia de realimentación del estado K es determinada de 
nera que el error (causado por perturbaciones) se reducirá a cero con suficiente velocidad. Ob 
que para un sistema dado, la matriz K no es única, sino que depende de las localizaciones en 
cerrado deseadas (que determinan la velocidad de respuesta) que se haya seleccionado. La selecci 
de los polos en lazo cerrado deseados o de la ecuación característica deseada es un punto medio 
la velocidad de la respuesta del vector de error y la sensibilidad a perturbaciones y a ruido en 
medición. Es decir, si aumentamos la velocidad de la respuesta de error, entonces, por lo gen 
aumentan los efectos adversos de las perturbaciones y de ruido en la medición. En la determinaca 
de la matriz de ganancia de realimentación del estado K para un sistema dado, es conveniente e 
nar varias matrices K basadas en varias ecuaciones características deseadas, y seleccionar aq 
que ofrezca un mejor desempeño general del sistema. 

Una vez seleccionada la ecuación característica deseada, existen varias formas de dete 
la matriz de ganancia de realimentación del estado K, correspondiente al sistema definido por 
ecuación (6-50), que se supone de estado completamente controlable. A continuación se listan 
tro de ellas. 


1. Como se mostró en el análisis anterior, la matriz K se puede obtener de la ecuación ( 
E ; ; a En 
K = [an — an: 0-1 — Gp-1:***:01 — aT 
z f 7; i 
= [an — Ap: Qn-1 — an-1: ttti a — a1](MW) ( 
donde las a, son los coeficientes de la ecuación característica del sistema original 


zI- G| = z" + az! ++, 12+0,=0 


y las a, son los coeficientes de la ecuación característica deseada, correspondiente al si 
de control con realimentación del estado; es decir, 


lzl— G + HK| = z” + 027 + t + an-z +a =O 


La matriz T está dada por 
T = MW (6- 


donde M y W corresponden a las ecuaciones (6-60) y (6-61), respectivamente. 
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Si la ecuación de estado del sistema ya está en la forma canónica controlable, la determinación 
de la matriz de ganancia de realimentación del estado K se puede simplificar, dado que la 
matriz de transformación T se convierte en la matriz identidad. En este caso, la matriz deseada 
K se obtiene sustituyendo T = MW = I en la ecuación (6-69). 


2. La matriz de ganancia de realimentación del estado K deseada puede obtenerse mediante la 
fórmula de Ackermann: 


K=[0 0 --- 0 1][H:GH:---:G”*H]* (G) (6-71) 
donde 
(G) = G" + aG! + -+ anG + 0,1 
3. Silos valores característicos que se desean 4,, 4», . . ., 4, Son distintos, entonces la matriz de 
ganancia de realimentación del estado K requerida puede ser: 


K=(L 1 +e IEEE (6-72) 


donde los vectores £,, &,. . . , £, satisfacen la ecuación 


E=(G-u4D'"H, i=1,2,...,n 


Observe que las £, son vectores característicos de la matriz G — HK, es decir, É, satisface la 


ecuación 
(G — HK); = pu €, ¡=1,2,...,n 
Para una respuesta sin oscilación, 4, = 4, =*** =p, = 0. La ecuación (6-72), en este caso, 
puede simplificarse como sigue: 
K=[1 0 +e 0[8:8:--:5,]” (6-73) 
donde 
& = GH, E, = GH, TEES E, =G"H 


[Para conocer los detalles de la deducción de las ecuaciones (6-72) y (6-73), vea los problemas 
A-6-12 y A-6-13.] 


4. Si es bajo el orden n del sistema, sustituya K =[Xk, : k,: +++ : k,] en la ecuación característica 


il — G + HK| = 0 


y a continuación haga coincidir los coeficientes de las potencias de z de esta ecuación caracte- 
rística, con potencias iguales de z de la ecuación característica deseada 


z” + az] +e + aztan 


Un cálculo directo de la matriz K como éste puede resultar más simple en sistemas de bajo 
orden. 


Ejemplo 6-6 
Considere el sistema 


x(k + 1) = Gx(k) + Hu(k) 
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donde 


Observe que 


z -1 


ll=Gl= 016 241 


=2+2+0.16 





Por lo tanto, 








qa = 1, da = 0. 16 
Determine una matriz de ganancia de realimentación del estado K adecuada, tal que el sistema tenga los 
polos en lazo cerrado en 


z =0.5 + j0.5, z=05-j0.5 


Primero examinemos el rango de la matriz de controlabilidad. El rango de 


m:em = |] 1 


es 2. Por lo tanto, el sistema es de estado completamente controlable, y es posible la ubicación arbitraria 
de polos. La ecuación característica para el sistema deseado es 


Izl — G + HK] = (z — 0.5 — j0.5Mz — 0.5 + j0.5) =2?*-2+05=0 
de modo que, 
œ = ~1, a, = 0.5 
Demostraremos cuatro formas para determinar la matriz K. 
Método 1. De la ecuación (6-69), la matriz de ganancia de realimentación del estado K está dada c 
sigue: 
K = [œ — a: œ — a] T~ 


Observe que el sistema original ya está en la forma canónica controlable, por lo que la matriz de transă 
mación T se convierte en I: 


1d [o Ma J [10 
r = mw = [H:6H] $ e A SR l 


K = [œ — a: œ — a] = [0.5 — 0.16: -1 — 1] 
= [0.34 -2] 
Método 2. Refiriéndonos a la fórmula de Ackermann dada por la ecuación (6-71), tenemos 
K=[0 1][H:GH]”' p(G) 


Por lo tanto, 


donde 


A _[-0.16 -1 |] | 0 1 ES 0 
AE | 0.16 al pen -1| "i0 05 
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En concecuencia, 
-1 
E 0 1 0.34 -2 
e ulg a le a 
= [0.34 -2j 


Método 3. De la ecuación (6-72), la matriz de ganancia de realimentación del estado K deseada, se 
determina como sigue: 


K=(1 118 €)” 
donde 


E = (G — mI) 'H, i=1,2 


Dado que u, = 0.5 + j0.5, 
E, = [G — (0.5 +50. 'H 














-1 
_ | -0.5 — jO.5 1 aaler TAT 
—0.16 —1.5 — j0.5 1 —0.5 — j0.5 
0.66 + j 
En forma similar, para u, = 0.5 — j0.5, 
Es = [G — (0.5 - j0.5)18] `H 
-1 
_[ -0.5 + 0.5 1 oa n] 
-0.16 -1.5 + j0.5 1| | -0.5+30.5 
0.66 — j 
En consecuencia, tenemos que 
=1 -1 -1 
0.66 + j 0.66 — j 
ios 
(E E -0.5 - j0.5 —0.5 + j0.5 


0.66 +j 0.66 — j 


0.7178(1 — j) 1.4356 
1 + 0.66 1 + 0.66 


-0.7178(1 + j) 1.4356 
—1 + ¡0.66 -1 + 70.66 
Por lo tanto se determina que la matriz de ganancia de realimentación del estado K deseada es 


K=[1 1)[8 8)” 


0.7178(1 — j)  -1.4356 
1 + j0.66 1 + 0.66 


=1 Ulloa + 1.4356 
—1 + j0.66 —1 + j0.66 
= [0.34 -2] 
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Con realimentación de estado u(k) = -Kx(A), la ecuación de estado se convierte en 
Observe que la solución de esta última ecuación está dada por 
Si los valores característicos 1, de la matriz G — HK se presentan dentro del círculo unitario, e 


ces el sistema es asintóticamente estable. 


G - HK como cero, es posible obtener la respuesta con oscilaciones muertas, es decir, 
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Método 4. Es de observarse que, para sistemas de bajo orden como éste, puede resultar más senc: 4 
sustituir 


K = [kx k] 


en la ecuación característica, y escribir la ecuación en función de las k aún sin determinar. De este mu 
esta ecuación será igual a la ecuación característica deseada. El procedimiento es el que sigue: 


z 0 0 1 0 
E d i q da Ë HE kal 
E | z -1 


1016+k, z+1+k 


= 22 + (1+ kəz +0.16+k,=0 
Ahora igualamos esta ecuación característica a la ecuación deseada 


lzl — G + HK| = 











(z — 0.5 — jO.S)(z — 0.5 + j0.5) = 0 


de modo que 


z? + (1+ k)z +0.16+k =22-2+0,5 


Comparando los coeficientes con potencias iguales de z, obtenemos 


1+k,=-1, 0.16 + k, = 0.5 
de donde 


kı = 0.34, ka = —2 
Por lo tanto, la matriz de ganancia de realimentación del estado K deseada es 
K=[k k} = [0.34 -2] 


Observe que para sistemas de orden superior, los cálculos involucrados en este método pueden ser 
laboriosos. En tal caso será preferible usar otros métodos. 


Respuesta con oscilaciones muertas. Considere el sistema definido por 


x(k + 1) = Gx(k) + Hu(k) 


x(k + 1) = (G — HK)x(k) 


x(k) = (G — HK)*x(0) (6-7 


A continuación demostraremos que si seleccionamos todos los valores característicos 


x(k) = 0, parak2q,q <n 


En el análisis de la respuesta con oscilaciones muertas, la matriz de potencia nula 
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010.. 0 
0.01 --++ 0 
Nsj:;i i £ 
000. 1 
000°. 0 
juega un papel de importancia. Considere, por ejemplo, la matriz de 4 x 4 de potencia nula: 
0100 
10010 
N= ioo 01 
0000 
Observe que 
0010 0.0.0 1 00.00 
0.0.0 1 00.00 0000 
2 y 4— 
N =io oook NSloooor NSjoooo 
0000 0000 009090 
En forma similar, para una matriz N de potencia nula de 1 x n, 
N" =0 
Ahora considere el sistema de estado completamente controlable dado por 
x(k + 1) = Gx(k) + Hu(k) (6-75) 
Hagamos que las localizaciones deseadas de los polos sean el origen, o bien, que los valores carac- 
terísticos deseados sean cero: 4, = 1,=***= u, = 0. Entonces podemos demostrar que la respuesta 


a cualquier estado inicial x(0) es con oscilaciones muertas. En vista de que la ecuación característica 
que tiene los valores característicos deseados puede darse por 


(z = m)(z = m) tt (Z = Hn) =z" + azl + e + aaz a = a" 
obtenemos 
s s a A S 
y la matriz K dada por la ecuación (6-65) puede simplificarse a: 
K = [an — ap} An- — anita ay E! 

= [~an -an e —a]T" (6-76) 

Utilizando la matriz de transformación T dada por la ecuación (6-32), definimos 
x(k) = Tx(k) 
Definimos también 
T 'GT=ĠĜ, T'H=Ĥ 

Entonces, la ecuación (6-75) se puede escribir como: 


X(k + 1) = T GTR(k) + T'Hu(k) = Gx(k) + Ĥu(k) 
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Si utilizamos la realimentación del estado u(k) =-Kx(k) =-kTx (k), entonces esta última ecuaciór 


convierte en 


X(k + 1) = (G - ÁKDIK(k) 


Por la ecuación (6-76), 


G —- KT = G — á[-a, Ana ++ —a] 
0 1 0 <. 0 0 
0 0 1 <- 0 0 
SS a ¡[| Ellea, ara + a] 

0 0 0 1 0 

Tan ân- TAn-2 41 1 
0 1 0 0 0 0 0 0 
0 0 1 0 0 0 0 0 
0o 0 0 1 0. 0 0 0 
Gn —An-1 TH 4An-2 yi 41 An TAn-1 —ân-2 AAA 41 

0.1.0 0 

0 0 1 0 

OOO si 

00.0 --- 0 


Así que G - KT es una matriz de potencia nula, por lo que 
(G - AKTy = 0 
En términos del estado original x(k), tenemos 
x(n) = (G — HK)"x(0) = (TT! - TÁAK)x(0) = [T(G — AKT)T”']"x(0) 


= T(G - KT" T" x(0) = 0 
De este modo hemos demostrado que si los valores característicos deseados son todos cero, ent 
cualquier estado inicial x(0) se puede llevar al origen en por lo menos n periodos de muestreo. 
respuesta es con oscilaciones muertas, siempre y cuando la señal de control u(k) sea no aco 


Comentarios acerca del control con oscilaciones muertas. El concepto de la respuesta 
oscilaciones muertas es único para los sistemas de control en tiempo discreto. En los sist 
control en tiempo continuo no existe la respuesta con oscilaciones muertas. En el control con 
ciones muertas, cualquier vector de error distinto de cero será llevado a cero en no más de n 
de muestreo, si la magnitud del control escalar u(k) no está acotada. El tiempo de asen 
depende del periodo de muestreo, ya que la respuesta se asienta en, a lo más, n períodos de m 
Si el período de muestreo T se escoge muy pequeño, el tiempo de asentamiento también sera 
pequeño, y esto implicará que la señal de control tenga una magnitud extremadamente grande. 
ser asi, no seria posible llevar la respuesta de error a cero en un período corto. 

En el control con oscilaciones muertas, el período de muestreo es el único parámetro de 
ño. Por lo tanto, si se desea una respuesta con oscilaciones muertas, el diseñador deberá escog 
cuidado el período de muestreo, de forma que en la operación normal del sistema no se req 
una magnitud de control extremadamente grande. Aprecie que no es fisicamente posible a 
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sin límite la magnitud de la señal de control. Si la magnitud es incrementada en forma suficiente, 
siempre tendrá lugar el fenómeno de saturación. Si la saturación ocurre en la magnitud de la señal de 
control, entonces la respuesta ya no podrá tener oscilaciones muertas. El tiempo de asentamiento 
será mayor que n períodos de muestreo. En el diseño real de los sistemas de control con oscilaciones 
muertas, el diseñador debe estar consciente del intercambio a efectuar entre la magnitud de la señal 
de control y la velocidad de respuesta. 


Ejemplo 6-7 


Considere el sistema dado por 


x(k+D|_ 0 1 x(k) 0 E 
p En? -016 -1l atot O (6-77) 
Determine la matriz de ganancia de realimentación del estado K, tal que cuando la señal de control esté 
dada por 

u(k) = —-Kx(k) 


el sistema en lazo cerrado (sistema de regulación) exhiba la respuesta con oscilaciones muertas a un 
estado inicial x(0). Suponga que la señal de control u(k) no está acotada. 
Refiriéndonos a la ecuación (6-76), para la respuesta con oscilaciones muertas, tenemos que 


K= [-a —a JT’ (6-78) 


El sistema dado por la ecuación (6-77) ya tiene la forma canónica controlable. Por lo tanto, en la ecuación 
(6-78), T = L La ecuación característica del sistema dado por la ecuación (6-77) es 


Izl — =z +z +0.16=z+az +a 


ai= i ea 
Y por lo tanto, 
a= 1l, a = 0.16 
En consecuencia, la ecuación (6-78) se convierte en 
K = [-a, -a] = [-0.16 -1] 


Esto proporciona la matriz de ganancia de realimentación del estado deseada. 
Verifiquemos que la respuesta del sistema a un estado inicial arbitrario x(0) es en realidad la 
respuesta con oscilaciones muertas. En vista de que la ecuación de estado en lazo cerrado se convierte en 


dk + DI 0 1 || x(k) 0 x(k) 
pan aego] flo TE 
_J0 1jj x(k) 
aao 
x1(0) _ ¿a 
kelb 
donde a y b son constantes arbitrarias, 
E _ E E A E 
xD | 10 0| x0) 0 
x(29]_fo 1x0] _ fo A 
x(2)| 10 0] (0D 0 0 
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Entonces, el estado x(k) para k = 2, 3, 4, . . . se convierte en cero y la respuesta tiene en + 
oscilaciones muertas. 


Ubicación de polos cuando la señal de control es un vector. Hasta este momento he: 
considerado el problema de la ubicación de polos cuando la señal de control es un escalar. Si la s 
de control es una cantidad vectorial (vector de dimensión r), se puede acelerar la respuesta. 
existe más libertad para escoger las señales de control u,(k), u,(k), . . ., u,(k) a fin de acelerar 
respuesta. Por ejemplo, en el caso de un sistema de orden n con un control escalar, la respuesta 
oscilaciones muertas se puede conseguir en a lo más n períodos de muestreo. En el caso del c 
de vector u(k), la respuesta con oscilaciones muertas puede conseguirse en menos de n períodos 
muestreo. 

En el caso del control con un vector, sin embargo, se hace más compleja la determinación de 
matriz de ganancia de realimentación del estado K. En el apéndice C presentaremos un caso de 
tipo. 


Sistema de control con entrada de referencia. Hasta ahora hemos considerado sistemas 
regulación. En el sistema regulador, la entrada de referencia queda fija durante un largo period 
las perturbaciones externas crean estados distintos de cero. La ecuación característica para el sisë 
determina la velocidad mediante la cual los estados no nulos se acercan al origen. A continuaci 
consideraremos el caso en el que el sistema tiene una entrada de referencia. 

Considere el sistema mostrado en la figura 6-2. La planta queda descrita por las sigu) 
ecuaciones de estado y de salida: 


x(k + 1) = Gx(k) + Hu(k) 

y(k) = Cx(k) 

La señal de control u(k) está dada por 
u(k) = Kor(k) — Kx(k) 
Si eliminamos u(k) de la ecuación de estado, tenemos que 
x(k + 1) = (G — HK)x(k) + HKor(k) 

La ecuación característica para el sistema es 

Ill — G + HK| = 0 
Como se enunció antes, si el sistema es de estado completamente controlable, entonces puede 


minarse la matriz de ganancia de realimentación K, a fin de que proporcione los polos en 
cerrado deseados. 


nk) yk) 


Planta 





Figura 6-2 Sistema de control con realimentación del estado. 
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Es importante señalar que la realimentación del estado puede modificar la ecuación caracterís- 
tica correspondiente al sistema, pero quej al hacerlo, se modifica la ganancia en estado permanente 
del sistema completo. Por lo tanto, es necesario tener una ganancia ajustable K, en el sistema. Esta 
ganancia K, debe ajustarse de tal forma que la respuesta escalón unitario del sistema en estado 
permanente sea la unidad, o que y(%) = 1. A fin de aclarar los detalles, veamos el siguiente problema 


de ejemplo. 


Ejemplo 6-8 


Considere el sistema definido por 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
u(k) = Kor(k) — Kx(k) 


0 1 0 
ET E: n=] gery] 


Diseñe un sistema de control tal que los polos en lazo cerrado deseados de la ecuación caracteristica estén 
en 


donde 


zı =0.5 +j0.5, z= 0.5 — j0.5 


Entonces el polinomio característico deseado está dado por 


zI — G + HK] = {z - 0.5 — j0.5)X(z — 0.5 + j0.5) 
=z -2+05 
La matriz de ganancia de realimentación del estado K puede ser determinada como 
K = [0.34 -2] 


(Vea el ejemplo 6-6 para la determinación de la matriz K.) 
Utilizando esta matriz K, la ecuación de estado se convierte en 


x(k + 1) = (G — HK)x(k) + HKor(k) 
= Gx(k) + Ĥr(k) 
donde 
G=G-HK, Ĥ=HK, 
La constante de ganancia K, puede determinarse en el espacio de estados o en el plano z, mediante la 


función de transferencia de pulso. En este ejemplo, utilizaremos este último método. 
La función de transferencia pulso Y(z)/R(z) para este sistema, es 


G(z) = C(z1 - G) Ê 


o a1J_fo 0 1 
aea E A j HS >a e A 


[eL 
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rík) 









Por lo tanto, 
-1 
z -1 0 
GUSH ol ds z- i a 
2-2+0.5 
Así que 


Y(z K 
a = G(z)= 3 E 
R(z) z-z +0.5 
Para determinar la constante de ganancia Ky, utilizamos la condición de que sea la unidad la salidz 
estado permanente y(>) para la entrada escalón unitario, es decir, 


lim y(k) = lim (1 — z*)Y(2) 
kx z=>1 











= li z=] Ko z 
"MTS AZ +0S5z-1 
=2K,= 1 
En comsecuencia, hemos determinado K) como 
Ko = 0.5 


La figura 6-3 muestra los diagramas de bloques del sistema diseñado. La respuesta escalón unite 
este sistema puede obtenerse con facilidad mediante el uso de MATLAB. El programa 6-1 de MA 
es uno de muestra para obtener la respuesta escalón unitario. La figura 6-4 muestra la curva de res 
resultante. 






yk) 
x (k+1) =G x(k) + Huik) 





la) 





(b) 
Figura 6-3 (a) Diagrama de bloques del sistema de control diseñado en el ejemplo 6-8; (b) diagrama de ble 
simplificado. 
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6-1 MATLAB PROGRAMA 





l. 
num=[0 0 0.5]; 
den=[1 -1 0.5]; 
r= 0nes(1,41); 
v=(0 40 0 1.6); 




















axis(v); 
k = 0:40; 
y = filter(num,den,r); 
plot(k,y,* 0°) 
grid 
title(` Respuesta escalón unitario”) 
xlebel("k”) 
ylebel( y(k)”) 
Respuesta escalón unitario 
= 
= 
TE A ARA O EE TE E aedd 
T e O e a E: 
DA heno Panai aa is botas barreras qn 
02 bin : ea bis] E ai : E : ANNEI : oa 
0 5 10 15 20 25 30 35 40 
k 


Figura 6-4 Respuesta escalón unitario del sistema mostrado en la figura 6-36). 





¡66 OBSERVADORES DE ESTADO 


En la sección 6-5 analizamos un método para el diseño de la ubicación de polos, que utiliza la 
¿ realimentación de todas las variables de estado, con el fin de formar el vector de control deseado. En 
la práctica, sin embargo, no todas las variables de estado están disponibles para la medición directa. 
En muchos casos prácticos, sólo son medibles unas cuantas variables de estado de un sistema dado, 
mientras que las demás no lo son. Puede ser, por ejemplo, que sólo las variables de salida son 


www.FreeLibros.me 






















422 Ubicación de polos y diseño de observadores Capítulo $ 







x(k) 









Observador 
de estado Figura 6-5 Diagrama esquemático del observador de 


estados. 






medibles. En este caso, será necesario estimar aquellas variables de estado que no puedan medirse 
directamente. Esa estimación suele llamarse observación. En un sistema práctico es necesario obser- 
var o estimar las variables de estado no medibles a partir de las variables de salida y las de control 

Un observador de estados, también conocido como estimador de estados, es un subsist 
del sistema de control que lleva a cabo una estimación de las variables de estado, a partir de | 
mediciones de las variables de salida y control. Aquí, el concepto de observabilidad analizado en 
sección 6-3 juega un papel importante. Como veremos más adelante, se pueden diseñar observ 
res de estados si, y sólo si, se satisface la condición de observabilidad. 

En los análisis siguientes de los observadores de estado, utilizaremos la notación X (A) 
designar el vector estado observado. En muchos casos, este vector X (k) se utiliza en la realiment 
del estado para generar el vector de control óptimo. En la figura 6-5 se muestra un esquema de 
observador de estados. El observador de estado tendrá y(X) y u(k) como entradas, y X (k) como 
lida. 

A continuación analizaremos, primero, la condición necesaria y suficiente para la observaca 
del estado, y después estudiaremos el observador de estados de orden completo. La observación 
estado de orden completo significa que observamos (estimamos) las n variables de estado, sin 1 
portar si algunas variables de estado están disponibles para la medición directa. A veces, € 
sólo necesitamos la observación de las variables de estado no medibles, pero no de aquellas di 
mente medibles, esto resulta innecesario. La observación de sólo las variables de estado no med: 
se conoce como observación de estado de orden reducido, y se analizará más adelante en esta 
ción, La observación de las variables de estado no medibles, además de algunas (no todas) las y 
bles de estado medibles, se conoce como observación de estado de orden reducido. 


Condición necesaria y suficiente para la observación del estado. La figura 6-6 muestra 
sistema de regulación con un observador de estados. Analizaremos una condición necesaria y 
ciente, según la cual puede observarse (estimarse) el vector estado. De la figura 6-6 obtenemos 
ecuaciones de estado y de salida como sigue: 


x(k + 1) = Gx(k) + Hu(k) (6- 
y(k) = Cx(k) ( 
donde 
x(k) = vector de estado (de dimensión n) 
u(k) = vector de control (de dimensión r) 
y (1) = vector de salida (de dimensión m) 
G = matriz no singular de n x n 
H = matriz de n x r 


C = matriz de mx n 
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Observador 
de estado 





Figura 6-6 Sistema de regulación, con un observador de estados. 


A fin de poder observar (estimar) las variables de estado, debemos ser capaces de obtener x(k + 1) en 
términos de y(k), y(k—1),..., y(k—n + 1), y u(k), u(«— 1), ...,u(k—n + 1). De la ecuación (6-79), 


G` x(k + 1) = x(k) + G~ Hu(k) 
es decir, 

x(k) = G™'x(k + 1) — G*Hu(k) (6:31) 
Desplazando k en 1, obtenemos 

x(k — 1) = G` x(k) — G*Hu(k — 1) (6-82) 
Sustituyendo la ecuación (6-81) en la ecuación (6-82) resulta 
x(k — 1) = G[G x(k + 1) — G*Hu(k)] - G*Hu(k — 1) 
= G?x(k + 1) - G?*Hu(k) ~ G'Hu(k — 1) 
En forma similar, 
x(k — 2) = G?x(k) — G?Hu(k — 1) - G'Hu(k — 2) 
= G?x(k + 1) - G*Hu(k) — G° Hu(k — 1) — G”'Hu(k — 2) 


x(k — n + 1) = G™”x(k + 1) - G” Hu(k) — G”*' Hu(k — 1) 
= +++ G’ Hu(k — n + 1) 
Sustituyendo la ecuación (6-81) en la ecuación (6-80), obtenemos 
y(k) = Cx(k) = CG" x(k + 1) — CG 'Hu(k) 
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Asimismo, 
y(k — 1) = Cx(k — 1) = CG”? x(k + 1) —- CG ?Hu(k) - CG~' Hu(k — 1) 
y(k — 2) = Cx(k — 2) = CG™° x(k + 1) — CG? Hu(k) - CG? Hu(k — 1) 
- CG 'Hu(k - 2) 


y(k — n +1) = Cx(k -n + 1) = CG "x(k + 1) - CG "Hu(k) 


-CG"""'Hu(k — 1) — +- —- CG Hu(k -n +1) 
Si combinamos las n ecuaciones anteriores en una ecuación matricial, obtenemos 
y(k) CG” 
ED LOG +1) 
yk-n+1)| [06 
CG®'H 0 +. 0 u(k) 
[CGH CGUH >> 0 u(k — 1) 
CG"H CG""H -> CGUH | u(k —n +1) 
o bien 
CG” y(k) 
-2 pS 
CG” heyl IED 
cG” y(k -n +1) 
CGIH) 0 > 0 u(k) 
+ CG?H CGH > 0 u(k — 1) 
CG"H CG""H +++ CG7H]|| uk —n +1) 


Observe que el segundo miembro de la ecuación (6-83) es totalmente conocido. Por lo tanto, x(k ~ 
puede determinarse si y sólo si 


Dado que la matriz G es no singular, multiplicar por G” cada uno de los renglones del primer 
bro de la ecuación (6-84) no cambia la condición de rango. Por lo tanto, la ecuación (6-84 
equivalente a 
leer] 
cG”? |_ 
rango : =y 
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que también equivalen a 
rango [C* G*C* +++ (G*Y”" C*]=n (6-85) 


Es claro que ésta es la condición de observabilidad completa del sistema definido por las ecuaciones 
(6-79) y (6-80). [Refiérase a la ecuación (6-17).] Esto significa que si se satisface la ecuación (6-85) 
(es decir, si el sistema es completamente observable), entonces se puede determinar x(k + 1) a partir 
de y(k), y(k- 1), ...,y(k-n+ 1) y u(k), u(k-1),..., u(x-n+ 1). Por lo tanto, hemos demostrado 
que la condición necesaria y suficiente para la observación del estado es que el sistema sea comple- 
tamente observable. 

Como caso especial, si y(k) es un escalar y la matriz C es una de 1 x n, entonces se puede 
obtener x(k + 1) premultiplicando ambos miembros de la ecuación (6-83) por el inverso de la matriz 
dada en la ecuación (6-84), como sigue: 


cG |” y(k) 
xp+19=| 067 | y =D 


CG] ly«-n+0 


ce] [CG7 H 0 z 0 u(k) 
y [CG?| [06H CGUH ++ 0 u(k — 1) 
CG] [06H CG7H + CGH) u(k=2»+1) 


(6-86) 


La ecuación (6-86) proporciona el valor x(k + 1) cuando y(k) es un escalar. 

Como quedó demostrado en el análisis anterior, el estado x(k + 1) puede determinarse a partir 
de la ecuación (6-83), siempre que el sistema sea completamente observable. Por lo tanto, para un 
sistema de esta clase, el vector de estado puede determinarse en n periodos de muestreo como máxi- 
mo. En presencia de perturbaciones externas y ruido en la medición, sin embargo, este método puede 
no ofrecer una determinación precisa del vector de estado. Por ello, para determinar el vector de 
estado, en presencia de perturbaciones y ruido en la medición, es necesario un enfoque distinto. 
Asimismo, si la matriz C no es una de 1 x n sino una de m x n (con m > 1), no puede definirse la 
inversa de la matriz de la ecuación (6-84), y la ecuación (6-86) no es aplicable. Con el fin de resolver 
estos casos, un método muy poderoso para la estimación del vector de estado es utilizar un modelo 
dinámico del sistema original, como sigue: 

Considere el sistema de control definido por las ecuaciones (6-79) y (6-80). Supongamos que 
el estado x(k) debe aproximarse al estado X (k) del modelo dinámico: 


X(k + 1) = Gx(k) + Hu(k) (6-87) 
y(k) = Cx(k) (6-88) 


donde las matrices G, H y C son las mismas que las del sistema original. Asimismo, supongamos 
que el modelo dinámico está sujeto a la misma señal de control u(k) que el modelo original. Si las 
condiciones iniciales para el sistema real definido por las ecuaciones (6-79) y (6-80), y para el 
modelo dinámico definido por las ecuaciones (6-87) y (6-88), son las mismas, entonces el estado 
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X (k) y el estado x(k) serán iguales. Si las condiciones iniciales son distintas, entonces el estado X (k) 


y el estado x(k) serán distintos. 
No obstante, si la matriz G es una matriz estable, X (k) se acercará a x(k), aun en el caso, que 


veremos, en que las condiciones iniciales sean diferentes. Si identificamos la diferencia entre x(k) y 
T (k) como e(k), o definimos 


e(k) = x(k) — x(k) 
entonces al sustraer la ecuación (6-87) de la ecuación (6-79), obtenemos 
x(k + 1) — x(k + 1) = G[x(k) — x(k)] 


es decir, 


e(k + 1) = Ge(k) 

















Si la matriz G es estable, entonces e(k) se acercará a cero y X (k) a x(k). Sin embargo, el comporta- 
miento del vector de error, que sólo depende de la matriz G, puede no ser aceptable. Asimismo, si la 
matriz G no es una matriz estable, entonces el error e(k) no se acercará a cero. Es, por lo tante. 
deseable modificar el modelo dinámico definido por las ecuaciones (6-87) y (6-88). 

Debe mencionarse que a pesar de que el estado x(k) puede no ser medible, la salida y(4) si lo es 
El modelo dinámico definido por las ecuaciones (6-87) y (6-88) no utiliza la salida medida y(A). El 
desempeño del modelo dinámico puede mejorar si se utiliza la diferencia entre la salida medida ves 
y la salida estimada CY (A) para vigilar o monitorear el estado X (4); es decir, si el modelo dinámica 
de la ecuación (6-87) se modifica de la forma siguiente: 


x(k + 1) = Gx(k) + Hu(k) + K.[y(k) — Cx(k)] 


donde la matriz K, sirve como matriz de ponderación. (Esto significa que la dinámica del observador 
de estados que se mostró en la figura 6-6 debe estar dada por esta última ecuación.) En presencia de 
discrepancias entre las matrices G y H utilizadas en el modelo y las del sistema real, la adición de 
diferencia entre la salida medida y la salida estimada ayudará a reducir las diferencias entre el m 
lo dinámico y el modelo real. 

A continuación analizaremos detalles del observador cuya dinámica está caracterizada 
matrices G y H, y por el término adicional de corrección, formado por la diferencia entre la sali 


medida y la salida estimada. 


Observador de estados de orden completo. El orden del observador de estados que se 
zará aquí es el mismo que el correspondiente al sistema. Como ya se indicó, un observador 
estados como éste se conoce como observador de estados de orden completo. 

En el análisis siguiente supondremos que el estado real x(k) no puede medirse en forma di 
ta. Si el estado x(k) debe estimarse, es conveniente que el estado observado o el estado esti 
Xx (k) sean tan cercanos al estado real x(k) como sea posible. Aunque no es necesario, resulta c 
niente que el observador de estados tenga las matrices G y H iguales a las del sistema original. 

Es importante observar que en el análisis presente, el estado x(k) no está disponible para 
medición directa y, en consecuencia, el estado observado X (k) no puede compararse con el e 
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Figura 6-7 Sistema de control con realimentación del estado. 


real x(k). Sin embargo, dado que la salida Y (k) = CX (k) sí puede medirse, es posible comparar y (X) 
= CxX (k) con y(k). 

Considere el sistema de control con realimentación del estado que se muestra en la figura 6-7. 
Las ecuaciones del sistema son 


x(k + 1) = Gx(k) + Hu(k) (6-89) 
y(k) = Cx(k) (6-90) 
u(k) = —Kx(k) 


donde 


x(k) = vector de estado (de dimensión n) 
u(k) = vector de control (de dimensión r) 
y(k) = vector de salida (de dimensión m) 
G = matriz no singular de n x n 
H = matriz de n x r 
C = matriz de m x n 
K = matriz de ganancia de realimentación de estado (matriz de m x r) 


Suponemos que el sistema es de estado completamente controlable y completamente observable, 
pero que x(k) no está disponible para medición directa. La figura 6-8 muestra un observador de 
estados incorporado el sistema de la figura 6-7. El estado observado X (k) se utiliza para formar el 
vector de control u(A), es decir 


u(k) = —Kx(k) (6-91) 
De la figura 6-8, tenemos que 


X(k + 1) = Gx(k) + Hu(k) + K.[y(k) — y(k)] (6-92) 


donde K, es la matriz de ganancia de realimentación del observador (una matriz de n x m). Esta 
última ecuación puede modificarse y resultar 


x(k + 1) = (G — K.C)k(k) + Hu(k) + K. y(k) (6-93) 
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Figura 6-8 Sistema de control con realimentación del estado observado. 


El observador de estados dado por la ecuación (6-93) se llama observador de predicción, pues 
estimado X (k + 1) está un período de muestreo adelante de la medición y(k). Los valores caracter 
ticos de G — K,G suelen conocerse como polos del observador. 


Dinámica del error de observador de estados de orden completo. Observe que si X tèt 
x(k), entonces la ecuación (6-93) se convierte en 


X(k + 1) = Gx(k) + Hu(k) 
que es idéntica a la ecuación de estado del sistema. Por lo tanto, si X (k) = x(X), la respuesta 


sistema de observador de estados es idéntica a la del sistema original. 
Para obtener la ecuación de error del observador, restemos la ecuación (6-93) de la ec 


(6-89): 
x(k + 1) — X(k + 1) = (G — K.C)[x(k) — X(%)] ( 


Ahora definamos la diferencia entre x(k) y X (k) como el error e(k): 


e(k) = x(k) — x(k) 
La ecuación (6-94) se convierte, entonces, en 
e(k + 1) = (G — K.Cje(k) ( 


De la ecuación (6-95) vemos que el comportamiento dinámico de la señal de error queda det 

do por los valores característicos de G — K,C. Si la matriz G — K,C es una matriz estable, el 

de error convergirá a cero para cualquier error inicial e(0). Es decir, X (k) convergirá a x(k) i 
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dientemente de los valores de x(0) y X (0). Si los valores característicos de G — K,C están localiza- 
dos de forma tal que el comportamiento dinámico del vector de error es adecuadamente rápido, 
entonces cualquier error tenderá a cero con una velocidad adecuada. Una forma de obtener una 
respuesta rápida es utilizar una respuesta con oscilaciones muertas. Esto puede obtenerse si a todos 
los valores característicos de G — K,C se les da un valor igual a cero 


Comentarios. Dado que el sistema definido por las ecuaciones (6-89) y (6-90) se supone comple- 
tamente observable, es posible una ubicación arbitraria de los valores característicos de G — K,C. 
Para explicar esto más ampliamente, observe que son iguales los valores característicos de G — K,C 
y los de G* — C*K | . Mediante el principio de dualidad presentado en la sección (6-3), la condición 
para la observabilidad completa del sistema definido por las ecuaciones (6-89) y (6-90) es la misma 
que la condición para la controlabilidad completa del estado para el sistema 


x(k + 1) = G*x(k) + C*u(k) (6-96) 


En la sección 6-5 vimos que la ubicación arbitraria de los polos es posible para el sistema de la 
ecuación (6-96), siempre y cuando sea de estado completamente controlable, o el rango de la matriz 


sea n. [Ésta es la condición para la observabilidad completa del sistema definido por las ecuaciones 
(6-89) y (6-90).] Para el sistema definido por la ecuación (6-96), mediante la selección de un conjun- 
to de n valores característicos deseados de G* — C*K, puede determinarse la matriz de ganancia de 
realimentación del estado K. La matriz deseada, K,, tal que los valores característicos de G — K,C 
son los mismos que los de G* — C*K, está relacionada con la matriz K mediante la ecuación K, = 
K*. 

Ejemplo 6-9 

Considere el sistema 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 


0 -—0.16 0 
0-30] a] eos 


Diseñe un observador de estado de orden completo, suponiendo que la configuración del sistema es 
idéntica a la mostrada en la figura 6-8. Los valores característicos deseados para la matriz de observador 
son 


donde 


z =0.5 + j0.5, z = 0.5 — j0.5 
y por lo tanto la ecuación característica que se requiere es 
(z — 0.5 — j0.5)X(z — 0.5 + j0.5)= z-z +0.5=0 


Dado que la configuración del observador de estados está especificada como se muestra en la 
figura 6-8, el diseño del observador de estados se reduce a la determinación de una matriz de ganancia de 
realimentación de observador K, apropiada. Antes de continuar, examinemos la matriz de observabilidad. 
El rango de 


[C*: G*C*] = E Al 
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es 2. Por ello, el sistema es completamente observable y es posible determinar la matriz de gananciz 
realimentación del observador deseada. 
Refiriéndonos a la ecuación (6-95), 


e(k + 1) = (G — K. C)e(k) 
donde 
e(k) = x(k) — x(k) 
la ecuación característica del observador se convierte en 
zI- G+K.C|=0 
Identifiquemos la matriz de ganancia de realimentación del observador K, como sigue: 
x= [k] 


Entonces, la ecuación caracteristica se convierte en 
1 0] fo -0.16] [x y 


z? + (1+ kaz + kı +0.16=0 


z 0.16 + ki 


O 











que se reduce a 


Dado que la ecuación característica deseada es 


z? —-z+05=0 
al comparar la ecuación (6-97) con esta última, obtenemos 


kı = 0.34, kı = -2 


_ [0.34 
K= [03] 


Observe que existe una relación dual entre la ecuación de estado del sistema considerado en el a 
6-6 y la del sistema presente. La matriz de ganancia de realimentación del estado K obtenia 
ejemplo 6-6 es K = [0.34 — 2]. La matriz de ganancia de realimentación del observador K, obter: 
se relaciona con la matriz K mediante la relación K, = K*. 


es decir, 


Diseño de los observadores de predicción. Hasta ahora hemos discutido los obs 
res de predicción de orden completo. Se trata de observadores de predicción porque el 
x (k + 1) está un período de muestreo delante de la medición y(). Resolvimos un prob 
ejemplo sencillo, suponiendo una matriz K, que determinaba que la ecuación característica -1 
K,C] = 0 tuviera valores característicos prescritos. A continuación analizaremos un métode 
general para determinar la matriz de ganancia de realimentación del observador K.. 

Considere el sistema definido por 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
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x(k) = vector de estado (de dimensión n) 
u(k) = vector de control (de dimensión 7) 
y(k) = señal de salida (escalar) 

G = matriz no singular de n x n 

H = matriz de n x r 

C =matrizde 1 xn 


El sistema se supone de estado completamente controlable y completamente observable. Por lo 
tanto, la inversa de 


existe. Asimismo, suponemos que la ley de control a utilizar es 


u(k) = -Kx(k) 


donde X (k) es el estado observado y K es una matriz de n x r. Supongamos, además, que la configu- 
ración del sistema es la misma que la mostrada en la figura 6-8. 
La dinámica del observador de estados está dada por la ecuación 


x(k + 1) = Gx(k) + Hu(k) + K.[y(k) — $(%)] 


Ñ (6-100) 
= (G — K.C)x(k) + Hu(k) + K. Cx(k) 
Primero definimos 
Q = (WN*)" (6-101) 
donde 
N = [C*:G*C*:.--:(G*)"!C*] (6-102) 
y 
An- Ana coo A 1 
An-2 înr-3 tt 1 0 
w=] : : po (6-103) 
a 1 --- 00 
1 0 >. 00 
donde a,, %», . . ., A„ı SON los coeficientes de la ecuación característica de la ecuación de estado 
original dada por la ecuación (6-98), 
lZl-G|=2"+a2"*"+---+a4,,2+4,=0 
A continuación, definamos 
x(k) = Qé(k) (6-104) 


donde £(k) es un vector de dimensión n. Utilizando la ecuación (6-104), las ecuaciones (6-98) y 
(6-99) podrán modificarse a la forma 
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E(k + 1) = Q” GQÉ (o) + Q7 Hu (k) (6-105) 
y(k) = CQE() (6-106) 
donde 
0.0 --- 0 -a 
a NA A (6-107) 
Gig ae A a 
cQ=[0 0 --- 0 1] (6-108) 


[Refiérase al problema A-6-9 para la deducción de las ecuaciones (6-107) y (6-108).] 
Ahora, se define 


IK) = QEU) (6-109) 
Sustituyendo la ecuación (6-109) en la ecuación (6-100), tenemos que 
E(k + 1) = Q(G — K.O)QÉ(k) + Q Hu(k) + Q7 K, COÉ(k) (6-110) 
Sustrayendo la ecuación (6-110) de la ecuación (6-105), obtenemos 
E(k + 1) — E(k + 1) = (Q'GQ — Q7 K, CQ[E(k) — E(k)] (6-111) 
Definamos 
e(k) = E(k) — Ẹ(k) 
Entonces, la ecuación (6-111) se convierte en 
e(k + 1) = Q UG — K. C)Qe(k) (6-112) 
Es necesario que la dinámica de error sea estable y que e(k) llegue a cero con velocidad suficiente. El 
procedimiento para la determinación de la matriz K, será, primero, seleccionar los polos de observa- 
dor deseados (los valores característicos de G — K,C) y, a continuación, determinar la matriz K, de 
manera que se dé los polos deseados. Si requerimos que e(k) llegue a cero tan pronto como sea 
posible, entonces se necesita que la respuesta del error tenga oscilaciones muertas, por lo que debe- 


mos seleccionar todos los valores característicos de G — K,C como cero. 
Observe que 


Gai BGn2 co 41 1 C kı 
an-2 Gn-3 1 0 CG kz 
kepi o: 
a 1 0 0 CG"? kn 
1 0 0 0|| CG] ka 
donde 
kı 
K. =|® 
kn 
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Dado que Q` K, es un vector de dimensión n, podemos escribir 


Ôn 
Sn- 
QK. =|! (6-113) 
ô 
A continuación, refiriéndonos a la ecuación (6-108), tenemos que 
Ôn 00: 0 6, 
Pres loo o O 
ôi 0.0 --+ 0 & 
y 
0 0 0 Sap = Ón 
1 0 0 —4An-1 Ón-1 
QG - K. C)Q = Q GQ - QK.CQ =|0 1 0 —4n-2— Ón-2 


0.0 >: 1 41 — ô 
La ecuación característica 


[zI — Q(G - K.C)Q| = 0 


se convierte en 


z 0.0 0 An + 6, 
-1 z 0 O ani + Ón-1 
0 -1 z +: 0 an+ | =0 
0 0.0 +++ -1 z+ a] + ô; 
es decir, 
z” + (a + 8)z™! + (a, + &)z"? + + (an+ e) =0 (6-114) 
Es fácil apreciar que cada uno de los ô,„, 9, ,, ..., 9, está asociado sólo a uno de los coeficientes de 


la ecuación característica. 
Suponga que la ecuación característica deseada para la dinámica de error es 


(z — m)(z — m): (2 — pn) 
= z" +02 + 0927 ?+-+--+0.12+04=0 (6-115) 


Observe que los valores característicos deseados y, (es decir, las localizaciones de los polos en lazo 
cerrado deseados) determinan la velocidad con la que el estado observado converge al estado real de 
la planta. Comparando los coeficientes de las potencias iguales de z en las ecuaciones (6-114) y 
(6-115), obtenemos 

as + ô; = 0 


a + & = 0 


An + Ôn = an 
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de la cual obtenemos 
ô; = 01 4 


Ó, = 0% — 0, 
ô, = An — an 
Entonces, de la ecuación (6-113), 
Ôn Qn — an 
QK, = | Či | = | 917 anmi (6-116) 
ôi a 4; 
Por lo tanto, 
Ax — An An — An 
K, = Q| 27%) = (WN 17 a (6-117) 
@i — 4; 0474 


La ecuación (6-117) especifica la matriz de ganancia de realimentación necesaria K,. La figura 6-9 
muestra una representación alterna del sistema de control con realimentación del estado observado. 

Una vez seleccionados los valores característicos deseados (o la ecuación característica que se 
desea), es posible designar el observador mediante un método similar al utilizado en el caso del 





Figura 6-9 Representación alterna del sistema de control con realimentación del estado observado. 
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problema de ubicación de polos. La ecuación característica deseada puede seleccionarse de tal forma 
que el observador responda por lo menos cuatro o cinco veces más aprisa que en el sistema en lazo 
cerrado; en algunas aplicaciones puede desearse una respuesta con oscilaciones muertas. 

Si queremos tener una respuesta con oscilaciones muertas, la ecuación característica deseada 
se convierte en 


Z=0 (6-118) 


Comparando la ecuación (6-114) con la ecuación (6-118), requerimos que 


a; + ôi =0 
143) + ô = 0 
an+ =0 
Por lo tanto, para la respuesta 
kı Ô, 4, 
K, =|% | = Q| Č] = (wn 7% (6-119) 
kn OA 41 


Fórmula de Ackermann. La expresión dada por la ecuación (6-117) no es la única disponi- 
ble para determinar la matriz de ganancia de realimentación del observador K,. A continuación, 
deduciremos la fórmula de Ackermann para la determinación de K.. 

Considere el sistema completamente observable definido por las ecuaciones (6-98) y (6-99). 
Observe que en este sistema la salida y(k) es un escalar. Refiriéndonos a la ecuación (6-115), la 
ecuación característica para la dinámica de error es 


zI — Q*GQ + Q'K.CQ| =0 (6-120) 
donde K, es una matriz de n x 1. Definamos 
QU6Q=6, QUK.=K,  CQ=C 
Entonces la ecuación (6-120) se convierte en 
IzI-G+K,.C|=0 


En el diseño del observador, determinamos la matriz K, de tal forma que su última ecuación 
característica sea idéntica a la ecuación característica deseada para el vector de error; ésta es 


z” + az"! + + 012 +04 =0 (6-121) 


Es decir, K A 
[71 G + K, Ĉ| = (2 — 1) — pm) t (Z — Hn) 
= z" + azi +. + aaz +a O0 


PAL E 


Il 
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donde 4,, ft», ..., 4, son los valores característicos de la matriz (G - K, C ). Para sistemas físicos. 
los valores característicos complejos siempre aparecen en pares complejos conjugados. En el análi- 
sis presente, supondremos que todos los valores característicos complejos se presentan en pares 
complejos conjugados, de tal forma que son reales los coeficientes œ;, %, .. . , œ, de la ecuación 
característica. De este modo, la ecuación característica para la matriz (G* — C* Ko) puede estar 
dada por 


21 — G* + Ĉ*K?| = (z — uu) — mh): (2 — Fa) 
=z" + az ++ +0. ¡2+0.=0 


donde p, es la conjugada compleja de y. 

En la sección 6-5 deducimos la fórmula de Ackermann para la determinación de la matriz de 
ganancia de realimentación del estado K, para el problema de diseño de la ubicación de polos. Ahi 
determinamos la matriz K, de tal forma que la ecuación caracteristica 


lzI— G + HK|=0 


sería la misma que la ecuación característica deseada, ecuación (6-121). Aqui, en el problema de 
diseño del observador, deseamos determinar la matriz K+, de tal forma que la ecuación caracteristica 









Izi — Ĝ* + C*K;] = 0 

sea la misma que la ecuación característica requerida dada por la ecuación (6-121). Es claro que 
estos dos problemas son uno dual (es decir, matemáticamente la determinación de la matriz K, es 
igual a la determinación de la matriz de ganancia de realimentación K del problema de la ubicaciór 
de polos). Por lo tanto, es posible utilizar los resultados obtenidos en la sección 6-5 con respecto à 
la determinación de la matriz K, para el problema actual, como se demostrará. 

En el problema del diseño de ubicación de polos analizado en la sección 6-5, para la ecuación 
del sistema 


x(k + 1) = Gx(k) + Hu(k) 


con realimentación del estado 


u(k) = —-Kx(k) 
la matriz deseada K se obtuvo según la ecuación (6-68), que se repite aquí: 
K=[0 0 --- 0 1][H:GH:---:G"*H]'4(G) (6-12) 


En este caso, en el problema del diseño del observador, para la ecuación de estado 
x(k + 1) = G*x(k) + C*u(k) 
con realimentación del estado 
u(k) = —Ki x(k) 
la matriz deseada K: puede, por lo tanto, obtenerse de manera similar a la ecuación (6-122), cor 
sigue: 
K3=[0 0 =- 0 1JO*:G*C* (Gr CG (6-1 
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que puede modificarse a 


Ki=[0 0 <- 0 1][C0*:G*C*:...: (G*)="C*](Q9) 7 4(G*) 
Si tomamos la transpuesta conjugada de ambos miembros de esta última ecuación, tenemos que 
c To 
a a e CG 0 
R. = nro] ES |: 
CG”! 1 
Si 
QUK, =K, 
obtenemos 
c | "To 
K. = 0960] “E | |S (6-124) 
CG” 1 


Observe que, dado que ^G = Q~ GQ, 
Q6'Q7"=G%,  k=0,1,2,...,1 
Y, en consecuencia, 
Q6(6)Q7' = QLÉ” + 4,67 +--- +0, 16 + a,1Q7 
= QÔ" Q + 9106 QT + +: + 0,-06Q7 + a, 1 


=G" + aG! ++ + aG + a I= (G) a 
Utilizando la ecuación (6-125), la matriz de ganancia de realimentación del observador K, requeri- 
da, dada por la ecuación (6-124), puede escribirse de nuevo en la forma: 


c Ifo 
K, = 4(G) e ; (6-126) 
ce] [1 


donde ¢(G) es el polinomio característico deseado de la dinámica de error. La expresión para K, 
dada por la ecuación (6-126) suele llamarse fórmula de Ackermann para la determinación de la 
matriz de ganancia de realimentación del observador K.. 


Resumen. El observador de predicción de orden completo está dado por la ecuación (6-92): 


xX(k + 1) = (G — K.C)x(k) + Hu(k) + K. y(k) 
La realimentación del estado observado es 


u(k) = —Kx(k) 


Si esta última ecuación se sustituye en la ecuación del observador, obtenemos 
xX(k + 1) = (G — K.C — HK)x(k) + K. y(k) 
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Esta ecuación define el observador de predicción de orden completo, cuando se incorpora el control 
con realimentación del estado observado. 

Como en el caso de los cuatro métodos para el diseño de la ubicación de polos, por lo regular 
disponibles para determinar la matriz de ganancia de realimentación del observador K, para el siste- 
ma completamente observable, se pueden resumir como sigue: 


1. Sinos referimos a la ecuación (6-117), la matriz de ganancia de realimentación del observador 
K, puede estar dada por 


An 7 Gn On 7 Gn 
o A O a (6-127) 
a — äi a — 4; 


donde las matrices N y W están dadas por las ecuaciones (6-102) y (6-103), respectivamente. 
Las a, son los coeficientes de la ecuación característica deseada 


z+ azl ++ +0-12+0,=0 
y las a, son coeficientes de la ecuación característica de la ecuación de estado original 
Ill — G| = z" + az! +++ + aniz +a, =O 


Observe que si el sistema ya tiene una forma canónica observable, entonces la matriz K, puede 
determinarse con facilidad, pues la matriz WN* se convierte en una matriz identidad, y por lo 
tanto, (WN*Y' = I. 





2. La matriz de ganancia de realimentación del observador K, puede estar dada por la fórmula de 
Ackermann, dada, a su vez, por la ecuación (6-126): 


c fo 
Kaga s (6-128) 
CG”! 1 
donde 
H(G)=G"+0G"'+---+0,-:G + a, 1 
3. Si los valores característicos deseados 4,, H», . . . , 4, de la matriz G — K,C son distintos, 
entonces la matriz de ganancia de realimentación del observador K, puede estar expresada por 
la ecuación 
Nı fa 
k.=|"| |! (6-129) 
mi L1 


donde las y, se definen como sigue: 


n = C(G- 1” 
Observe que los n; son los vectores característicos de la matriz (G — K,C)*. 


En el caso especial en que se desee que el vector de error exhiba una respuesta con 
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oscilaciones muertas, de tal forma que 4, = 4, =* + = u, = 0, la ecuación (6-129) puede 
simplificarse. La ecuación siguiente dará la matriz K, para el caso de la respuesta con oscila- 
ciones muertas: 


-1 
Nı 1 
K,=|™® o (6-130) 
Nn 0 


donde las y, están dadas por la ecuación 


n; = CG”, i = 1,2,3,...,n 
[Para detalles de la deducción de las ecuaciones (6-129) y (6-130), vea los problemas A-6-12 
y A-6-13.] 

4. Siel orden del sistema es bajo, suponga una matriz de ganancia de realimentación del observa- 
dor K, con elementos desconocidos. Entonces los elementos de la matriz K, pueden determi- 
narse igualando los coeficientes con potencias iguales de z de 

lzIl — G+ K.C] 
y del polinomio característico requerido, que está dado por 
(z — 4) mm) (Z — Hn) = Z” + 027 4++>-+0 12 +0, 
donde las y, son los valores característicos deseados de G — K,C. 
Ejemplo 6-10 


Considere el sistema del doble integrador dado por las ecuaciones 
x(k + 1) = Gx(k) + Hu(k) 


y(k) = Cx(k) 


1 T Tn 
G=| el ase C=[1 0] 


y Tes el período de muestreo. (Vea el problema A-5-16 para la deducción de las ecuaciones en el espacio 
de estados en tiempo discreto correspondientes al sistema del doble integrador.) Suponga que la configu- 
ración del observador es la misma que la mostrada en la figura 6-8, para diseñar un observador de estados 
para este sistema. Se desea que el vector de error exhiba una respuesta con oscilaciones muertas. Utilice 
los cuatro métodos distintos, listados en el análisis anterior. 

Primero, verifique la condición de observabilidad. Observe que el rango de 


; 11 
* o GXO*] = 
[C*: G*C*] e 


es 2. Por lo tanto, el sistema es completamente observable. A continuacion examinamos la ecuación 


característica del sistema: 
z 0 1 T z=1i =T 2 
- = =2-22+1=0 
E 1 E a e 


Comparando esta ecuación característica con 


donde 


zI - G| = 





z+az+a=0 
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obtenemos 


a = —2, a=1l 


En vista de que se desea una respuesta con oscilaciones muertas, la ecuación caracteristica deseada para 
la dinámica del error es 


2+oz2+o=22=0 
Por lo tanto, 
Q = 0, Q: = 0 


Método I. Refiriéndonos a la ecuación (6-127), tenemos que 


K. = mv a K = cono) +[ =] 


donde N y W, definidas por las ecuaciones (6-102) y (6-103), respectivamente. son 


N = [C*: G*C*] = E »| 


las] 


Por lo tanto, la matriz de ganancia de realimentación del observador K, se obtiene como sigue: 


e E E 


Método 2. De la ecuación (6-128), la fórmula de Ackermann, K, está dada por 
c | To 
ii E sol ¿| H 


H(G) =G +014G + 071= G? 
Por lo tanto, la matriz de ganancia de realimentación del observador K, se obtiene como sigue: 


e-o ffi s fa 


an $ ° fo]? 
Lo IEE 
T T T 


Método 3. Puesto que se desea una respuesta con oscilaciones muertas, de la ecuación (6-130) tenemos 


donde 


donde 
MY F CG”, T = CG? 
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Observe que 


Los vectores y, y y, se obtienen como sigue: 


wen of Ho 2] 


wen a | -n ol 27 q -27] 


Por lo tanto, la matriz de ganancia de realimentación del observador K, se obtiene como sigue: 


1 -r fa] j2 1141] 12 
a ME 0 El EA PE 
T T T 


Método 4. Suponemos que 


y expandimos la ecuación característica como sigue: 


1 0 1 T kı 
elo lo l fele o 
e l ag 1 + kı -T | 
k2 z-=1 
Dado que deseamos una respuesta con oscilaciones muertas, esta ecuación característica debe ser igual a 


IZI- G +K.C|= 





=z + (k -2)2+1-k+k:.T=0 


De modo que, 


es decir, 


MES 


Verifiquemos que el vector de error se reduce a cero cuando mucho en dos períodos de muestreo. 
Observe que la matriz de coeficientes para la ecuación de error se convierte en 


swei i]: 


01 Hoe 


a 
bi 
donde a, y b, son arbitrarias, y X (0) se Supone que es 


wle] 
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Si el estado inicial x(0) está dado por 


x(0) = 


Poe 
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donde a, y b, son también arbitrarias, entonces 
e 2 41 — a2 — a 
e(0) ES x(0) x(0) E = a a 
donde a y b son constantes arbitrarias. Ahora. la ecuación (6-95) se convierte en 
ek + D]_ A Tle(k) ex(0)]_fa 
elk + 1) = T 1 e(k) d e2(0) b 


Los vectores e(1) y e(2) se determinan como sigue: 


E E E T H E -a + bT 

e(1) -7 ! b -a+b 

y 
[2] de T dd : Ta - [e] 
ex(2) =7 1 = qa +b qa b=Lar+b 0 


Es claro que el vector de error e(k) se convierte en cero en cuando mucho dos períodos de muestreo, Por 

lo tanto, la respuesta con oscilaciones muertas. Observe que para cualquier estado inicial x(0), el vector 

de estado observado se vuelve idéntico al vector de estado actual en, a lo mucho, dos períodos de muestreo. 
Finalmente, la ecuación del observador es 


a E 2 2 
le r o F lan +| i pao 
Poa -1 afew] ] 2 A 


[Observe que ésta es la ecuación dada por la ecuación (6-93).] 


Comentarios sobre la selección de la mejor K,  Refiérase a la figura 6-8 y observe que la 
señal de realimentación a través de la matriz de ganancia de realimentación del observador K, sirve 
de señal de corrección al modelo de la planta, con el fin de tomar en cuenta las incógnitas en la 
misma. Si están involucradas incógnitas significativas, la señal de realimentación a través de la 
matriz K, debe ser relativamente grande. Sin embargo, si la señal de salida está muy contaminada 
por perturbaciones y ruido en la medición, la salida y(X) no será confiable y la señal de realimentación 
a través de la matriz K, deberá ser relativamente pequeña. En la determinación de la matriz K, (que 
depende de los valores característicos deseados 4), Hz,- . . , U„), se debería examinar cuidadosamente 
los efectos de las perturbaciones y de ruido implicados en la salida y(x). 

Recuerde que la matriz de ganancia de realimentación del observador K, depende de la ecuación 
característica deseada 


d(2) = (2 — m)(z — pa) ooo (2 = Mn) =0 
La selección de un conjunto de ¿,, H, . . . , 4, no es única. Por lo tanto, se pueden seleccionar muchas 
ecuaciones características diferentes como ecuaciones características deseadas. Para cada una de 
éstas tendremos una matriz K, distinta. 
En el diseño del observador, es conveniente determinar varias matrices de ganancia de 
realimentación del observador K, basadas en varias ecuaciones características deseadas distintas. 
Para cada una de las matrices diferentes K,, deberán llevarse a cabo pruebas de simulación a fin de 


evaluar el desempeño resultante del sistema. A continuación seleccionaremos la mejor K, desde el 
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punto de vista del desempeño general del sistema. En muchos casos prácticos, la selección de la 
mejor matriz K, se reduce a un punto intermedio entre una respuesta rápida y la sensibilidad a 
perturbaciones y ruido. 


Efectos de la adición del observador en un sistema en lazo cerrado. En el proceso del 
diseño de la ubicación de polos, supusimos que el estado verdadero x(k) estaba disponible para la 
realimentación. Pero en la práctica, el estado verdadero x(k) puede no ser medible, por lo que será 
necesario que utilicemos el estado observado Y (A). Investiguemos ahora los efectos de la utilización 
del estado observado Ñ (A), en lugar del estado verdadero x(k), sobre la ecuación característica de un 
sistema de control en lazo cerrado. 

Considere el sistema de estado completamente controlable y completamente observable, defi- 
nido por las ecuaciones 


x(k + 1) = Gx(k) + Hu(k) 


y(k) = Cx(k) 
Para el control con realimentación del estado basado en el estado observado X (A), tenemos que 
u(k) = —Kx(k) 


Con este control, la ecuación de estado se convierte en 
x(k + 1) = Gx(k) — HKx(k) = (G — HK)x(k) + HK[x(x) — X(4)] (6-131) 
La diferencia entre el estado real x(k) y el estado observado Y (k) se ha definido como el error e(A): 
e(k) = x(k) — x(k) 
Sustituyendo el vector de error e(A), la ecuación (6-131) se convierte en 
x(k + 1) = (G — HK)x(k) + HKe(k) (6-132) 
Observe que la ecuación de error del observador fue dada en la ecuación (6-95), que se repite aquí: 
e(k + 1) = (G — K.C)e(k) (6-133) 
Combinando las ecuaciones (6-132) y (6-133), obtenemos 


LA afrek] 


Esta ecuación describe la dinámica del sistema de control con realimentación del estado observado. 
La ecuación característica para el sistema es 





a -G+ HK -HK =0 
0 z21-G+K,C 
es decir, 
lz1 — G + HK||zI - G + K.C| =0 (6-134) 


Observe que los polos en lazo cerrado del sistema de control con realimentación del estado observa- 

do están formados por los polos debidos sólo al diseño de ubicación de polos, además de los polos 

que se deben sólo al diseño del observador. Esto significa que el diseño de ubicación de polos y el 
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diseño del observador son independientes uno del otro. Pueden diseñarse por separado y combinars= 
para formar el sistema de control con realimentación del estado. 

Los polos en lazo cerrado que se desea que se generen mediante realimentación del estado 
(ubicación de polos) se seleccionan en forma tal que el sistema satisfaga los requisitos de desempe- 
ño. Los polos del observador por lo general se seleccionan para que la respuesta del observador sea 
mucho más rápida que la respuesta del sistema. Una regla práctica es escoger una respuesta de 
observador por lo menos cuatro a cinco veces más rápida que la respuesta del sistema, o, en algunos 
casos, escoger todos los polos del observador en el origen (para una respuesta con oscilaciones 
muertas). En vista de que el observador no es, por lo general, una estructura de hardware, sino un 
programa de computadora, es posible aumentar la velocidad de respuesta u obtener la respuesta con 
oscilaciones muertas de forma que el estado observado converja con rapidez al estado verdadero. La 
velocidad máxima de respuesta del observador queda generalmente limitada sólo por los problemas 
de ruido y de sensibilidad involucrados en el sistema de control. 










Observador actual. En el observador de predicción, se obtiene el estado observado X (k) a 
partir de mediciones del vector de salida hasta y(k — 1) y del vector de control hasta u(k— 1). Por lo 
tanto, el vector de control u(x) = -KY (KA) no utiliza la información de la salida actual y(A). Una 
formulación diferente del observador de estados consiste en utilizar y(k) para la estimación de X (4: 
Esto se puede llevar a cabo separando el proceso de observación en dos pasos. En el primer paso. 
determinamos z(k + 1), que es una aproximación de x(k + 1) basada en X (k) y u(k). En el segundo 
paso, utilizamos y(k + 1) para mejorar z(k + 1). La z(k + 1) mejorada es X (k + 1). El observador de 
estado basado en esta formulación se conoce como observador actual. 

Considere el sistema de estado completamente controlable y completamente observable, def- 
nido por las ecuaciones 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
donde 


x(k) = vector de estado (de dimensión n) 
u(k) = vector de control (de dimensión r) 
y(k) = vector de salida (de dimensión m) 
G = matriz de n x n 
H = matriz de n x r 


C = matriz de m x n 


Las ecuaciones del observador actual están dadas por 
x(k + 1) = z(k + 1) + K.[y(k + 1) — Cz(k + 1)] (6-13 
z(k + 1) = Gx(k) + Hu(k) (6-13 


La ecuación (6-136) da la predicción z(k + 1) con base en X(k) y u(k) en la etapa k. La ecu 
(6-135) indica que, midiendo y(k + 1), podemos mejorar z(k + 1) para obtener X (k + 1). 
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Defina el error de observador e(A) como sigue: 
e(k) = x(k) — x(k) 
Entonces, 
e(k + 1) = x(k + 1) — x(k + 1) 

Gx(k) + Hu(k) — (Gx(k) + Hu(k) + K(C[Gx(k) + Hu(k)] 
- C[Gx(k) + Hu(k)])) 
= (G — K. CG)[x(k) — x(k)] 
= (G — K, CG)e(k) 


Por lo tanto, la ecuación de error del observador para el observador actual es similar a la del obser- 
vador de predicción dada por la ecuación (6-95). Sin embargo, en la dinámica de error aparece una 
diferencia. La matriz K, puede obtenerse exactamente como en el caso del observador de predicción, 
excepto por que la matriz C queda remplazada por la matriz CG. Para hacer posible que los valores 
característicos de (G — K,CG) se ubiquen en forma arbitraria, el rango de la matriz 


cG c 
2 

cel | ce lg 

cG"'| [cem 


debe ser n. Observe que si la matriz G es no singular, entonces esta condición es equivalente a la 
condición de observabilidad, es decir, 


rango [C* : G*C* i- i (GĦ! C*]=n 


Si el rango de la matriz de observabilidad es n, entonces los valores característicos de 
G — K,CG pueden ubicarse en forma arbitraria mediante una selección adecuada de K,, y la matriz 
K, puede determinarse de manera similar a como se hizo en el caso del observador de predicción. En 
la determinación de la matriz K,, remplazamos la matriz C por CG en los cálculos involucrados. Por 
ejemplo, si la salida y(k) es un escalar, la fórmula de Ackermann, como se dio en la ecuación (6- 
126), se modifica a la forma correspondiente: 
-1 


CG 0 
ce | lo 

K.= (Gl: : (6-137) 
ce™!| lo 
ce | l1 


Sin embargo, si la matriz G es singular, entonces el rango de 


es q, que es menor que n. En este caso, escribamos 
(G — K, CG)* = G* — G*C*K = G* — BK/ 


donde B = G*C*. Observe que la matriz (G* — B Ko tiene la misma forma que la matriz (G — HK), 
que jugó un papel importante en el diseño de la ubicación de polos. 
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Con un análisis similar al dado en la sección 6-5 [refiérase a las ecuaciones (6-55) y (6-57)], es 
posible utilizar una matriz de transformación adecuada para transformar las matrices G y Ben G* y 
B , donde 


G* = TI G*T = (El B=T'"B= EN 
? 0 


y donde todos los valores característicos de la matriz G}, no controlable de (n — q) x (n — q) se 
puedan hacer cero. (Por lo tanto, se puede estabilizar el sistema.) A continuación, defina 


KT = Š? = [K2,:K3,] 


Entonces, 
A BoA l * A 
èr- bk: = E FRI is 
- [Gh Bu Rä | Gh — Bu R4 
0 i G% 


Por lo tanto, si la matriz G es singular y el rango de la matriz de observabilidad es q, sólo necesita- 
mos especificar q valores característicos de la matriz de q x q G i -B¡¡K?,,. 


Observador de orden mínimo. Los observadores analizados hasta ahora están diseñados 
para reconstruir todas las variables de estado. En la práctica, algunas de las variables de estado 
pueden medirse con precisión. Estas variables de estado medibles con precisión no necesitan ser 
estimadas. Un observador que estime menos de n variables de estado, donde n es la dimensión del 
vector estado, se conoce como observador de orden reducido. Si tal observador es el mínimo posi- 
ble, el se conoce como observador de orden mínimo. 

Suponga que el vector de estado x(k) es uno de dimensión n y que el vector de salida y(k) es de 
dimensión m, que puede medirse. Dado que las variables de salida m son combinaciones lineales de 
las variables de estado, m variables de estado no necesitan ser estimadas. Sólo necesitamos estimar 
n— m variables de estado. Entonces, el observador de orden reducido se convierte en un observador 
de orden (n — m). Un observador de orden n — m como éste, es el observador de orden mínimo. La 
figura 6-10 muestra el diagrama de bloques de un sistema con un observador de orden mínimo. 

Es importante notar, sin embargo, que si la medición de las variables de salida incluyen ruido 
significativo y son relativamente poco precisas, la utilización de un observador de orden completo 
puede dar como resultado un mejor desempeño del sistema. 

El observador de orden mínimo puede diseñarse dividiendo primero el vector de estado x(k) 
en dos partes, como sigue: 


donde x,(k) es aquella porción del vector de estado que puede medirse en forma directa [por lo tanto, 
x,(k) es un vector de dimensión m] y x,(k) es la porción no medible del vector de estado [así que x,(k) 
es un vector de dimensión (7 — m)]. Luego, las ecuaciones de estado divididas se convierten en: 


[keta lenero] aho e% 
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Observación de 
orden mínimo 





y(k) 
Figura 6-10 Sistema de control de realimentación del estado observado, con un observador de orden mínimo. 


y(k) = (1: oo! (6-139) 


donde 


G,, = matriz de m x m 


aa 
G,, = matriz de m x (n — m) 
G,, = matriz de (n — m) x m 
Ga, = matriz de (n — m) x (n — m) 
H, = matriz de m x r 
H, = matriz de (n — m) x r 


Reescribiendo la ecuación 6-138, la ecuación correspondiente a la porción medible del estado se 
convierte en 


xalk + 1) = Go Xa(k) + Ga xo (k) + H, u(k) 
es decir, 


Xalk + 1) — Ga Xa(k) — Ha u(k) = Ga x(k) (6-140) 
donde son medibles los términos del primer miembro de la ecuación. La ecuación (6-140) actúa 
como ecuación de salida. En el diseño del observador de orden mínimo, consideremos el primer 
miembro de la ecuación (6-140) como una cantidad conocida. De hecho, la ecuación (6-140) rela- 
ciona las cantidades medibles con las no medibles deł estado. 
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De la ecuación (6-138), la ecuación de la porción no medible del estado se convierte en 


x(k + 1) == Gba Xalk) +F Gss x(k) + H, u(k) (6-141) 


La ecuación (6-141) describe la dinámica de la porción no medible del estado. Observe que los 
términos G}, X,(k) y H, u(x) son cantidades conocidas. 

El diseño del observador de orden mínimo puede facilitarse si utilizamos la técnica de diseña 
desarrollada para el observador de orden completo. Comparemos la ecuación de estado correspon- 
diente al observador de orden completo, con la correspondiente al observador de orden mínimo. La 
ecuación de estado para el observador de orden completo es 


x(k + 1) = Gx(k) + Hu(k) 
y la “ecuación de estado” para el observador de orden mínimo es 
Xo(k + 1) = Gro X»(k) + [Goo xa(k) + H, u(k)] 
La ecuación de salida para el observador de orden completo es 
y(k) = Cx(k) 
y la “ecuación de salida” para el observador de orden mínimo es 
Xa(k + 1) — Gao Xa(k) — Ha u(k) = Ga xo (k) 


El diseño del observador de orden mínimo se puede llevar a cabo efectuando las sustituciones que se 
dan en la tabla 6-1 en la ecuación para el observador de orden completo, dada en la ecuación (6-93 
y que repetimos aquí: 


x(k + 1) = (G — K.¿Cix(k) + Hu(k) + K.y(k) (6-142: 
Efectuando la sustitución de la tabla 6-1 en la ecuación (6-142), obtenemos 
Xo(k + 1) = (Go — K. Ga)Xo(k) + Go, Xalk) + H, u(k) 
+ K.[xa(k + 1) — Gas X4(k) — H, u(k)] (6-1433 


TABLA 6-1 LISTA DE SUSTITUCIONES NECESARIAS PARA ESCRIBIR LA 
ECUACION DE OBSERVADOR PARA EL OBSERVADOR DE ESTADOS DE ORDEN 




















MÍNIMO 
Observador de estados de orden completo Observador de estados de orden mínimo 
X% X ¿(k) 
G G» 
Hu(k) Ga X¿(k) + H; u(k) 
y (4) Xalk + 1) — Goa X¿(k) — H, u(k) 
C Go, 
K,, matriz de n x m K., matriz de (n — m) x m 
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donde la matriz de ganancia de realimentación del observador K, es una de (7 — m) x m. La ecuación 
(6-143) define el observador de orden minimo. 
Refiriéndonos a la ecuación (6-139), tenemos que 


y(k) = x,(k) (6-144) 
Sustituyendo la ecuación (6-144) en la ecuación (6-143), obtenemos 
Xo(k + 1) = (Gpo — K. Ga)žo(k) + Koy(k + 1) 
+ (Gr, — K: Ga)y(k) + (Hs — K.H,Ju(k) (6-145) 


Observe que para estimar X (k + 1) se necesita el valor medido de y(k + 1). Esto no es conveniente, 
por lo que desearíamos algunas modificaciones. [En el caso del observador de orden completo, X (k 
+ 1) puede estimarse utilizando la medición y(A) y no requiere de la medición de y(k + 1). Vea la 
ecuación (6-93).] Volvamos a escribir la ecuación (6-145) como sigue: 


ko(k +1) — Koy(k + 1) = (Go — K.Go) Xp (k) + (Gra — Ko Go.) y(k) 
+ (H, — K.H,Ju(k) 
= (Gss — K.Gas)[x (4) — Koy(k)] + (Gpo ~ K. Ga)K.y(k) 
+ (Go, — Ko Go) y(k) + (Hs — K, H,Ju(k) 
= (Go — K.Go)[X,(k) — Koy()] + [Go — Ko Go) Ko 


+ Goa — K; Galy(k) + (H, — K. H,Ju(k) (6-146) 
Definamos 
x(k) — K. y(k) = xo(k) — K. x(k) = n(k) (6-147) 
y 
ko(k) — K. y(k) = Ko(k) - K.xa(k) = (k) (6-148) 


Entonces, la ecuación (6-146) se puede escribir como sigue: 
ník + 1) F (Ga z K. Ga )M(k) T ECGs q K. Ga)K. + Goa 
— K, Galy(k) + (H — K,H,Ju(k) (6-149) 


Las ecuaciones (6-148) y (6-149) definen la dinámica del observador de orden mínimo. Observe que 
para obtener n(k + 1) no necesitamos el valor medido de y(k + 1). 
A continuación obtengamos ta ecuación de error del observador. Definamos 


e(k) = n(k) — (o) = x(k) — Xo(k) (6-150) 
Rotando la ecuación (6-143) de la ecuación (6-141), se tiene 
x(k + 1) — x(k + 1) = Gylxs(k) — Xo(k)] + K. Ga Xi(k) 
— K[xa(k + 1) — Ga Xalk) — H, u(k)] 
Sustituyendo la ecuación (6-140) en esta última ecuación, obtenemos 
x(k + 1) — Xx (k + 1) = Goolxo(k) — ž(k)] + K. Ga xo (k) — Ko Go xo (k) 
= (Go) — K. Ga )[x»(k) — xo (k)] 
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Esta última ecuación se puede dividir en la forma 


e(k + 1) = (Ge — K, Ga)e(k) (6-151) 


Ésta es la ecuación de error del observador. Observe que e(k) es un vector de dimensión (n — m). La 
dinámica de error puede determinarse como se desee, siguiendo la técnica desarrollada para el ob- 
servador de orden completo, siempre y cuando el rango de la matriz 


Go 
Gas Gos 


n=m-1 
Ga Gis 


sea n — m. (Ésta es la condición de observabilidad completa aplicable al observador de orden míni- 
mo.) 

La ecuación característica para el observador de orden mínimo se obtiene a partir de la ecuación 
(6-151), como sigue: 


Izl — G» + K. Ga] = 0 (6-152) 


La matriz de ganancia de realimentación del observador K, puede determinarse a partir de la ecua- 
ción (6-152) seleccionando primero las localizaciones de los polos en lazo cerrado deseados para 
el observador de orden mínimo [esto es, ubicando las raíces de la ecuación característica, ecuación 
(6-152) en las posiciones deseadas] y, a continuación, mediante el uso del procedimiento desarrolla- 
do para el observador de predicción de orden completo. 

Si, por ejemplo, la salida y(k) es un escalar, entonces x,(k) será un escalar, G,, una matriz de 
1 x (1-1), y G;, una de (n — 1) x (1— 1). Para este caso, la fórmula de Ackermann, como se dio en 


la ecuación (6-126), puede modificarse para obtener 
-1 


Ga 0 
Go Go, 0 
K. = d(G»») i l (6-153) 
Ga Gi? 0 
Ga Gi 1 
donde ki 
PCG) = Gr" + a Gip +- + Op-2Gp + apil (6-154) 


Resumen. Una vez determinada la matriz de ganancia de realimentación del observador K.. 
que es una de (7 — m) x m, se puede definir el observador de orden mínimo, mediante las ecuaciones 
(6-148) y (6-149): 


Xo(k) FR ník) as K. x¿(k) 
Nk + 1) = (Gu — K.Go)n(k) + [(Goo — Ke Ga)Ko + Goa — Ko Gaaly(k) 
+ (H, — K. H,)u(k) 


En forma equivalente, en términos de e(k), más que de 7 (k), se puede definir el valor de orden 
mínimo mediante las ecuaciones (6-150) y (6-151): 


Xo(k) = x(k) — elk) (6-155) 
e(k + 1) = (Gø — K.G.»)e(k) (6-156) 
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Sistema de control con realimentación del estado observado con observador de orden 
mínimo. Considere el sistema de estado completamente controlable y completamente observable, 
dado por 


x(k + 1) = Gx(k) + Hu(k) (6-157) 
y(k) = Cx(k) (6-158) 


donde x(k) es un vector de dimensión n, u(k) es un vector de dimensión r y y(k) es un vector de 
dimensión m. Las matrices G, H y C están dadas por 


Ga ! G H ; 
G=|-221 32m. = | = ; 
E a2, H ES] C = [I,, : 0] 


Considere la combinación de control con realimentación del estado, en la que el estado realimentado 
está formado por la porción medida del estado y la porción observada (estimada) del mismo, obteni- 
da mediante el observador de orden mínimo. La figura 6-11 muestra el diagrama de bloques corres- 
pondiente al sistema. En este sistema el vector de control u(A) es 


u(k) = —Kx(k) (6-159) 





Figura 6-11 Esquema de control con realimentación del estado, en el que el estado realimentado está constiituido 
por la porción medida del estado y la porción observada del mismo, obtenida mediante el uso del observador de 
orden mínimo. 
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donde Y (k) está formado por el estado medible x,(k) y el estado no medible (observado) X ¿(k): 
r zo] | xa(k) | 
Xk) = |=] S lot 6-160 
| o ES ROn P 
Sustituyendo la ecuación (6-159) en la ecuación (6-157), obtenemos 


x(k + 1) = Gx(k) — HKx(k) = (G — HK)x(k) + HK[x(k) — X(k)] (6-161) 


El a a 


donde e(k) = x(k) — X (k). Defina 


Observe que 


Entonces, utilizando esta matriz T, la ecuación (6-161) puede reescribirse como sigue: 
x(k + 1) = (G — HK)x(k) + HKTe(k) (6-162) 


Las ecuaciones (6-162) y (6-156) caracterizan el sistema de control con realimentación del estado. 
en el que el estado realimentado está constituido por la porción medida del estado, x,(X), y la porción 
observada del estado, X ,(x), obtenida mediante la utilización del observador de orden mínimo. Com- 
binando las ecuaciones (6-162) y (6-156), resulta que 


A P [S HKT Jf x(k) 
| elk + T) 0 | Gs- K, Gs 28] a 
La ecuación (6-163) caracteriza la dinámica del sistema con realimentación del estado observado. 


mediante un observador de orden minimo. La ecuación característica del sistema es 


zI — G + HK 


[i 
I 
Tenei Yon 


0 y zI- G» + K, Go, 
= |zI — G + HK||zI — Gp + K.G.] =0  (6-164) 





La ecuación (6-164) implica que los polos en lazo cerrado del sistema incluyen los polos en lazo 
cerrado debidos a la ubicación de polos [los valores característicos de la matriz (G — HK)] y los 
polos en lazo cerrado debidos al observador de orden mínimo [los valores característicos de la ma- 
triz (Gy — K, G,,)]. 


Ejemplo 6-11 
Considere el sistema con doble integrador en tiempo discreto definido por las ecuaciones 
x(k + 1) = Gx(k) + Hu(k) (6-165) 
y(k) = Cx(k) (6-166) 


donde el período de muestreo T se supone de 0.2, es decir, T = 0.2, y 


T? 
1 7|_]1 02 _|=|_/0.02 _ 
o=|; E 1 | H = E le | Cc=[(1 0] 
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Utilizando la técnica del diseño de la ubicación de polos, determine la matriz de ganancia de 
realimentación del estado K tal que los polos en lazo cerrado del sistema queden localizados en 


LL = 0.6 + j0.4, Z= 0.6 a j0.4 


Suponiendo que la salida y(k) = x,(k) es la única variable de estado que puede medirse, diseñe un obser- 
vador de orden mínimo tal que la señal de error exhiba una respuesta con oscilaciones muertas a un error 
inicial arbitrario. Determine la función de transferencia pulso para el controlador (formado por el control 
mediante realimentación del estado y el observador de orden mínimo). 

Primero examinaremos la controlabilidad y la observabilidad del sistema. Dado que el rango de 
las matrices 


¿uy — [0.02 0.06 : 4 do 1 
micu] = [0 0.2 | mec =|} A 


en ambos casos es 2, el sistema es de estado completamente controlable y completamente observable. 

Ahora resolveremos la porción de la ubicación de polos del problema. Dado que 
z-1 -02 
0 z-=1 





izl — G| = =72-22+1=2+02+40.=0 
tenemos que 
a = -2, a=1 
La ecuación característica deseada es 
lzl — G + HK| = (z — 0.6 — j0.4)(2 — 0.6 + 0.4) = z? — 1.22 + 0.52 


zZ+az+a=0 


Por lo tanto, 
a = -1.2, A = 0.52 
De la ecuación (6-65) se obtiene la matriz de ganancia de realimentación del estado K, como sigue: 


K = [a - mia — a]T™ = [-0.48 0.8]T" (6-167) 
a il loo 00 =2 4 
T = (m: Gu] 4 e 0.2 ll 1 I 
_[ 0.02 0.02 
-02 02 
a [as 25 
a -|3 a 


Por lo tanto, la matriz de ganancia de realimentación del estado K, dada por la ecuación (6-167), se 
convierte en 


donde 


K = [-0.48 osz ela: 3.2] 


La señal de control de realimentación puede entonces estar dada por 
u(k) = —Kx(k) 


= -[8 32] al = [8 sa (6-168) 
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A continuación, resolveremos la porción de observador del problema. En vista de que el estado 
x(k) es un vector 2 y la salida y(k) es un escalar. el observador de orden mínimo es de primer orden. 


Observe que 
Gus ¡Guo (1102 Ha | 002 
Gba ! Gob 011 P H, 0.2 


Dado que deseamos una respuesta con oscilaciones requeeri, la ecuación característica requerida para el 
observador es 


$(2)=2=0 
Refiriéndonos a la fórmula de Ackermann, como fue dada por la ecuación (6-153), obtenemos 
Ke = (Go) [Ga] [1] = (1)(0.2) '(1) = 5 
Refiriéndonos a la ecuación del observador de orden mínimo, dada por la ecuación (6-149), resulta que 
m(k + 1) = (Gss — K.Gas)m(k) + [(Goo — KeGao)Ko + Goa — Ko Gas] y(k) 
+ (H, — K.H,ju(k) 
= (1-5x0.2)9(4) + [0 -5x0.2)x5+0-5x 1]y(k) 

+ (0.2 — 5 x 0.02Ju(k) 

que puede simplificarse a la forma 
n(k + 1) = —Sy(k) + 0.lu(k) (6-169)) 


La ecuación (6-169) define el observador de orden mínimo. 
El control con realimentación del estado observado u(4) ahora se da por 


u(k) = —Kx(k) = —8x,(k) — 3.2%(k) = —8y(k) — 3.2%(k) (6-170) 
donde, refiriéndonos a la ecuación (6-148), 
Xa(k) = K.y(k) + n(k) = Sy(k) + m(k) (6-171) 


En la figura 6-12 se muestra el diagrama de bloques del sistema. De las ecuaciones (6-169), (6-170) y 
(6-171), obtenemos 


$ 


u(k + 1) = —8y(k + 1) - 3.2[5y(k + 1) + n(k + 1)] 


—24y(k + 1) + 16y(k) — 0.32u(k) 


li 


es decir, 
u(k + 1) + 0.32u(k) = —24y(k + 1) + 16y(k) 


Si tomamos la transformada z de esta última ecuación, y suponemos condiciones iniciales cero, obtene- 
mos 


zU(z) + 0.32U(z) = -24zY(z) + 16Y(z) 


La función de transferencia pulso del regulador es 





U(2) _ o? - pes) - z| - oessa") 


ISA A 0 1 + 0.322" 


(6-172) 


Al referirnos a la ecuación (5-60), la función de transferencia pulso del sistema, definida por las 
ecuaciones (6-165) y (6-166), puede ser obtenida como sigue: 
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* Sistema con doble integrador 


ES Í AA] 

















Observador de orden mínimo 


Figura 6-12 Diagrama de bloques del sistema diseñado en el ejemplo 6-11. 


Y(2) _ Ley! 
UG) = G,(z) = C(zI - G) 'H 


=1 
E z-1 -02] [0.02 
2 ol 0 al La 
_0.02(z + 1) _ 0.02(1 +22” 


s a ey (6-173) 


Utilizando las funciones de transferencia pulso de las ecuaciones (6-172) y (6-173), el diagrama de 
bloques de la figura 6-12 puede modificarse a la forma mostrada en la figura 6-13. 


Utilizando la forma dada por la ecuación (6-164), 


|zI — G + HK][z — Gs, + K: Gal = 0 


hemos obtenido la ecuación característica siguiente para el sistema: 


(2? — 1.22 + 0.52)(z - 1 + 5 x 0.2) = (2? — 1.22 + 0.52)z = 0 (6-174) 


La ecuación característica para el sistema en lazo cerrado, mostrado en la figura 6-13, es 


1 + Gp(2)Go(2) = 0 
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0.0211 +27 )27! 
(1-20 





pre -1 
Eo ( 0.66672 ) 
1 +0.32z7' 





— Gptz) 


Figura 6-13 Forma modificada del diagrama de bloques del sistema diseñado en el ejemplo 6-11. 
es decir, 
0.0211 + 23)z >” 1 — 0.6667z* 
T ALTERS 24 AE =0 
(1-25) 1 + 0.32z 
que se puede escribir como sigue: 


0.022 + 1) |f (2 — 0.6661 | 
MES PEE 


Y, de una manera sencilla, esta ecuación característica se puede simplificar a 


(z? — 1.22 + 0.52)z = 0 





t 
que es igual a la ecuación (6-174) obtenida mediante la ecuación (6-164). 


Sistema de control con entrada de referencia. Aplicaremos el método de realimentación 
del estado observado, para diseñar sistemas de control que deban seguir entradas de referencia cam- 
biantes. 

Es importante observar que la ubicación de polos con el enfoque o método del estado obsery a- 
do no tiene control sobre la dinámica del numerador del sistema en lazo cerrado. (Para controlar la 
dinámica del numerador, consulte el método de ecuaciones polinomiales presentado en el capítulo 
7.) Sin embargo, es posible transformar un sistema de regulación con realimentación del estada 
observado, en un sistema de contro), como se muestra en la figura 6-14. 

Como se dijo antes, la parte de la ubicación de polos determina la ecuación característica de 
grado n deseada para el sistema de orden n. La porción de observador de estados determina la 
ecuación característica de error del observador de grado n o menor. Tal y como se obtiene de la 
ecuación (6-134) o la (6-164), el producto de la ecuación característica de grado n y la ecuación 
característica de error del observador de estados da la ecuación característica correspondiente a la 
totalidad del sistema. 

Al modificar el sistema de regulación en un sistema de control, es necesario incluir una ganan- 
cia ajustable K, en la trayectoria de entrada, de tal forma que la ganancia de entrada de la totalidad 
del sistema de control pueda determinarse para que sea la unidad la salida en estado permanente a 
una entrada escalón unitario, Esto se debe a que la ubicación de polos con el observador de estados 
modifica la ganancia de la totalidad del sistema. Por lo tanto, a menos que K, esté correctamente 
ajustada, el sistema no se comportará en forma correcta. 


www.FreeLibros.me 


Sección 6-6 Observadores de estado 457 






rik} 
x{k+1)=Gx(k)+Hul(k} 






Observador 


Figura 6-14 Diagrama de bloques de un sistema de control con realimentación deł estado observado. 


Ejemplo 6-12 

Modifique el sistema de regulación considerado en el ejemplo 6-11 a un sistema de control, tal que 
la salida siga la entrada de referencia. A continuación, obtenga la respuesta escalón unitario y la respues- 
ta rampa unitaria del sistema de control. (Suponga que el período de muestreo T es 0.2, es decir, que 
T=0.2.,) 

La figura 6-15 muestra un diagrama de bloques posible para el sistema de control. En este sistema 
de control es necesario definir la ganancia K, de forma que no exista desplazamiento en la salida a una 
entrada escalón. (Observe que si K,= l, entonces la salida en estado permanente para una entrada escalón 
unitario no será igual a la unidad, excepto en casos especiales.) 

Del diagrama de bloques, la función de transferencia pulso en lazo cerrado M=/R(z) es 


Y(z) _ Ko(0.02)(z + 0.32)(z + 1) 

R(z) (z — Dz + 0.32) + 0.48(z + 1)(z — 0.6667) 
_ Ko(0.02)(z + 0.32)(z + 1) 
2 z? = 1.22 + 0.52z 





El sistema es de tercer orden. 

Antes de examinar el comportamiento del sistema, es necesario determinar la constante de ganan- 
cia K¿. Supongamos que R(z) es la transformada z de la secuencia escalón unitario. Entonces, la salida en 
estado permanente está dada por 







0.02(z + 1) 
(2-1? 





Figura 6-15 Sistema de control obtenido modificando el diagrama de bloques que aparece en la 
figura 6-13. 
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lim y(k) = lim[( — 27 )Y(2)] 


lim z — 1 K0(0.02)(2 +0.32(2 +1) z 
pao 27-122 + 0.527 z-1 


= 0.165Ko 
Establecemos la ganancia Ko de modo que 








y (00) = 0.165Ko = 1 


es decir, 


= 6.0606 
Sustituyendo K, = 6.0606 en la función de transferencia de pulso en lazo cerrado. obtenemos 
Y(z) N 0.1212z° + 0.16z + 0.03879 
R(2) z?’ — 1.22? + 0.522 


La respuesta escalón unitario de este sistema puede obtenerse con facilidad utilizando MATLAB. 
Un programa MATLAB de muestra para la obtención de la respuesta escalón unitario aparece en el 
MATLAB Program 6-2. La respuesta escalón unitario resultante se tiene en la figura 6-16. 














MATLAB Programa 6-2 z 


num = [0 0.1212 0.1600 0.03879]; 
den= [1 -1.2 0.52 Oj; 

r = ones(1,41); 

v=[0 40 O 1.6); 

axis(v); 

k = 0: 40; 

y = filter(num,den,r ); 
plot(k,y,'o') 

grid 

title(? Respuesta escalón unitario”) 
xlabel('k') 

ylabel('y(k)") 








Asimismo, la respuesta rampa unitaria puede obtenerse si se introduce el programa MATLAB 
Program 6-3 en la computadora. La respuesta rampa unitaria resultante aparece en la figura 6-17. 

El error que sigue a la entrada rampa unitaria se obtiene como sigue: si observamos que el periodo 
de muestreo T es 0.2, la entrada rampa unitaria está dada por 


0.27 ' 


R(z) "ay -z7 


Entonces, obtenemos 





E(z) = R(2) ro =|1 Zare) 








R(2) 
2 1,32122? + 0.362 — 0.03879 0.2z 
z? - 1.22% + 0.52z (z - 1) 
(2 = 1)(2? — 0.3212z + 0.03879) 0.22 
z? — 1.22? + 0.522 (z - 1y 
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Figura 6-16 Respuesta escalón unitario del sistema de control mostrado en la figura 6-15 con K, = 0.0606. 





den = [1 
k = 0:20; 







axis(v); 






grid 





xlabel('k') 








Por lo tanto, 


El error en estado permanente al seguir la entrada rampa unitaria es 0.4485. (Vea la figura 6-17.) 


ylabel(' y(k)') 


-1.2 0.52 0); 


r = (0.2*k]); 
v=[0 20 O 4j; 


y = filter(num,den,r ); 
plot(k,y,'o',k,y,'-',k,0.2*k,'--") 


title(Unit-Ramp Response') 


lim e(k) = lim 
k>% z=>1 Z 


= 0.4485 
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z? — 1.22? + 0.52z 


MATLAB Programa 6-3 


num = [0 0.1212 0.1600 0.03879); 


z — 1 (z — 1)(z? — 0.3212z + 0.03879) 0.2z 


(z - 1 


459 


460 Ubicación de polos y diseño de observadores Capítulo 6 


Respuesta rampa unitaria 
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Figura 6-17 Respuesta rampa unitaria del sistema de control mostrado en la figura 6-15, con K, = 0.0606. 


6-7 SISTEMAS DE SEGUIMIENTO 


Por lo general, en el sistema de seguimiento es necesario que el sistema tenga uno o más integradores 
dentro del lazo cerrado. (A menos que la planta a controlarse tenga una propiedad integradora, a fin 
de eliminar el error en estado permanente a entradas escalón, es necesario añadir uno o más integradores 
dentro del lazo.) 

Una forma de introducir un integrador en el modelo matemático de un sistema en lazo cerrado. 
es introduciendo un nuevo vector de estado, que integre la diferencia entre el vector de comando R 
y el vector de salida Y. La figura 6-18 muestra una configuración posible del diagrama de bloques 
para un sistema de seguimiento con realimentación del estado y control integral. El controlador 
integral está formado por m elementos integradores, uno por cada uno de los componentes de la 
entrada de comando. (La entrada de comando es un vector de dimensión m y tiene m componentes. + 
El integrador puede incluirse como parte de la formulación de la ubicación de polos presentada en la 
sección 6-5. 


Sistema de seguimiento con integrador. Considere el sistema de seguimiento mostrado en 
la figura 6-18. Se supone que la planta es de estado completamente controlable y completamente 
observable. Suponga que la planta no tiene un integrador. La ecuación de estado de la planta y su 
ecuación de salida son 


x(k + 1) = Gx(k) + Hu(k) (6-175) 
y(k) = Cx(k) (6-1761 
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Controlador integra! 








Figura 6-18 Sistema de seguimiento con realimentación del estado y control integral. 


donde 
x(k) = vector de estado de la planta (de dimensión 7) 
u(k) = vector de control (de dimensión r) 
y(k) = vector de salida (de dimensión m) 
G = matriz de n x n 
H = matriz de n x m 
C = matriz de m x n 


(Observe que en el análisis presente suponemos que las dimensiones del vector de salida y del vector 
de control son iguales; ambos son vectores de dimensión m.) La ecuación de estado del integrador es 


v(k) = v(k — 1) + r(k) — y(k) (6-177) 
donde 
v(k) = vector de error de actuación (vector de dimensión 7) 


r(k) = vector de entrada de comando (vector de dimensión 77) 


La ecuación (6-177) puede volverse a escribir como sigue: 


v(k + 1) = v(k) + r(k + 1) - y(k +1) 
= v(k) + r(k + 1) — C[Gx(k) + Hu(k)] 


=CGx(k) + v(k) — CHu(k) + r(k + 1) (6-178) 


Ii 


El vector de control u(k) está dado por 
u(k) = —K>x(k) + K, v(k) (6-179) 


En nuestro sistema de seguimiento, la configuración del sistema queda especificada en la figura 
6-18. Los parámetros de diseño son las matrices K, y K.. 
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A continuación analizaremos el procedimiento para determinar de las matrices K, y K,, de 
forma que el sistema tenga los polos en lazo cerrado deseados. De las ecuaciones (6-175), (6-178) y 
(6-179), obtenemos 


u(k + 1) = —K,x(k + 1) + K, v(k + 1) 

(K: = K,G => K, CG)x(k) 

+ (In — K,H — K, CH)u(k) + K,r(k + 1) (6-180) 
Si observamos que u(k) es una combinación lineal de los vectores de estado x(k) y v(k), podemos 


definir un nuevo vector de estado formado por x(k) y u(k) [en vez de x(k) y v(k)]. De las ecuaciones 
(6-175) y (6-180) obtenemos la siguiente ecuación de estado: 


Es + J 
u(k + 1) 
=l - a K,CG 1, -—K, ha K, lol ji Hz +1) (6-181) 


La ecuación de salida, ecuación (6-176), puede escribirse como sigue: 


y(k) = [C a[o] (6-182) 


Observe que los polos en lazo cerrado del sistema están determinados por el sistema mismo, y no 
dependen de la entrada de comando r(k). En la ecuación (6-181), los valores característicos de la 
matriz de estado determinan los polos en lazo cerrado del sistema. 

Para aplicar en forma directa la técnica de la ubicación de polos de la sección 6-5 al diseño del 
sistema de seguimiento presente, considere el caso en el que el vector de comando r(k) es un vector 
constante (entrada escalón), de forma que 


r(k) = r 
Entonces, la ecuación (6-181) se convierte en 


bor 


ea G H x(k) 0 
p P gaa K,G A K, CG b; zag K, -H - K, alao] + Fa (6-183) 


Observe que para la entrada escalón, x(k), u(k) y v(k) tienden a los valores de vector constantes x(%). 
u(2o) y v(20), respectivamente. Por lo tanto, de la ecuación (6-177), obtenemos la ecuación siguiente 
en estado permanente: 


v(%) = v(=) + r — y(%) 
es decir, 
URL =r 
En la salida no hay error en estado permanente cuando la entrada de comando es un vector escalón. 
Asimismo, en estado permanente, la ecuación (6-183) se convierte en 


Fi : p - E K,CG ir- R K, a hi ES (6-184) 
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Definamos los vectores de error por 
xe(k) = x(k) — x(00) 
u.(k) = u(k) — u(%) 


A continuación, restando la ecuación (6-184) de la ecuación (6-183), obtenemos 


Es + J z | G H xe(k) (6-185) 
u.(k + 1) K, - K,G-K,¡CG 1, — K,H — K,CH || u,(k) i 


La dinámica del sistema queda determinada por los valores característicos de la matriz de estado, 
que aparecen en la ecuación (6-185). La (6-185) puede modificarse a 


xk +1)|_[(G Hi xk) 0 
e + i F E aked t MITO (6-186) 
donde 
Si definimos e 
[x.k] 


&k) = Lu (K) = (n + m)-vector 


Ĝ ar H |= (r+ m) x 01+ m) matriz 
0.0 
~ [o] , 
H E O TAa 
K =-K,-K,G -K, CG: Ll, -K, H- K, CH] 


=m X (n+ m) matriz (6-188) 


las ecuaciones (6-186) y (6-187) se convierten, respectivamente, en 


Elk + 1) = GE(k) + Ĥw(k) (6-189) 
o (6-190) 
w(k) = —KE(k) 
Observe que la matriz de controlabilidad del sistema definido por la ecuación (6-189) es 
[411 G:---:G"”'Á = matriz de (n + m) x m(n + m) 


En términos de G y de H, esta matriz de controlabilidad puede escribirse como sigue: 


l 1 I... i Arn! I... | Qr+im-2 
0 y H, GH. iG H ::::G"”"H (6-191) 
E A A 0 

En vista de que la ecuación de estado de la planta, dada por la ecuación (6-175), se supone de estado 
completamente controlable, el rango de la matriz 
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es n. Por lo tanto, el rango de la matriz dada por la ecuación (6-191) es n + m. En consecuencia, si la 
planta es de estado completamente controlable, el sistema definido por la ecuación (6-189) es de 
estado completamente controlable y, por lo tanto, en este caso es aplicable la técnica de ubicación de 
polos analizada en la sección 6-5. 

Una vez especificados los polos en lazo cerrado deseados, es posible determinar la matriz K 
mediante la técnica de ubicación de polos. Utilizando la matriz K así determinada, podemos obtener 
las matrices K, y K,, como sigue. Primero, obsérvese que 


Fl = [K,G — K, + K,CG:K,H + K,CH] (6-192) 


Entonces, de las ecuaciones (6-188) y (6-192), tenemos que 
K = [K,G — K; + K,CG:-L,, + K,H + K,CH] 


Por lo tanto, 
Kai K| Sh E) = K + 1051.) (6-193) 


Las matrices K, y K, deseadas pueden determinarse a partir de la ecuación (6-193). 

Debe observarse que, cuando u(k) es un vector de dimensión m, y m > 1, la matriz K no es 
única. En consecuencia, es posible determinar más de un conjunto de matrices K, y K,. (Cada K 
posible genera un conjunto de matrices K, y K,.) En general, debe escogerse el conjunto de K, y K- 
que dé el mejor desempeño general del sistema. 

Finalmente, hay que notar que si no son medibles todas las variables de estado, entonces 
necesitaremos utilizar las variables de estado observadas en lugar dé las variables de estado no 
medibles, para fines de la realimentación del estado. (Asimismo, si las variables de estado medidas 
están contaminadas por ruido y, en consecuencia, no son precisas, para fines de realimentación del 
estado preferiremos utilizar las variables de estado observadas, y no las variables de estado actua- 
les.) En la figura 6-19 se muestra un diagrama de bloques para el sistema de seguimiento, con 
realimentación del estado, en el cual en vez del estado real se utiliza el estado observado. 


Ejemplo 6-13 

Considere el control digital de una planta mediante el uso de realimentación del estado y contro: 
integral. Suponga que la configuración del sistema es la misma que la que se muestra en la figura 6-18. 
También que la función de transferencia pulso de la planta es 


Y(z) _ z>? +0.52 
U(z) 1- z` + 0.0127? + 0.127? 


donde Y(z) y U(z) son las transformadas z de la salida de la planta, y(k), y de la entrada de planta (seña: 
de control), (k), en forma respectiva. 

Determine la constante de ganancia integral K, y la matriz de ganancia de realimentación de. 
estado K,, de forma que la respuesta a una entrada de comando escalón unitario tenga oscilaciones 
muertas. Suponga que no todas las variables de estado están disponibles para medición directa, y utilice 
la configuración de sistema mostrada en la figura 6-19 como ejemplo para un diagrama de bloques de ur. 
sistema con un observador de estados, a fin de diseñar un observador de estados tal que el estado obser- 
vado tienda al estado verdadero tan rápido como sea posible. 





(6-194) 
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Figura 6-19 Sistema de seguimiento con realimentación del estado observado. 


Primero obtendremos una representación en el espacio de estados para la función de transferencia 
pulso de la planta. Comparando la función de transferencia pulso dada con la forma estándar 


Y(z)  bo+biz*+b22*+b32 7 
U(2) 1+az'+az’+ az” 


encontramos que 
bo sa 0, bı a 0, ba 1, bz =0.5 
a = -1, da = 0.01, ad = 0.12 


Entonces, refiriéndonos a las ecuaciones (5-8) y (5-9), podemos obtener las ecuaciones siguientes en el 
espacio de estados para la planta: 


x(k + 1) = Gx(k) + Hu(k) (6-195) 
y(k) = Cx(k) (6-196) 
donde 0 1 0 0 
G= 0 0 11, H=|0), C=[0.5 1 0 
0,12 -0.01 1 1 


Observe que esta planta es de estado completamente controlable y completamente observable. 


Determinación de la constante de ganancia integral K, y de la matriz de ganancia de realimentación 
del estado K, para una respuesta con oscilaciones muertas. Ahora determinaremos la constante de 
ganancia integral K, y la matriz de ganancia de realimentación del estado K,. En el sistema presente es 
necesario que la respuesta a la entrada de comando escalón tenga oscilaciones muertas. (Por lo tanto, 
deberemos ubicar los polos en lazo cerrado del sistema en el origen.) 
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Refiriéndonos a las ecuaciones (6-189) y (6-190), tenemos 
Elk + 1) = GE(k) + Hw(k) 
w(k) = —KE(k) 


donde 

010 
-|C 8 0 o 110 
00 70.12 -0.01_ 1/1 
0 NO 

0 

O Y 

a 

1 


Capítulo Ó 


Nuestro problema aquí es determinar la matriz K de forma tal que los polos en lazo cerrado del sistema 


queden en el origen, es decir, que la ecuación característica deseada sea 


zt=0 


Mediante la técnica de ubicación de polos analizada en la sección 6-5, se puede determinar fácilmente la 
matriz K. Refiriéndonos a la fórmula de Ackermann, tal y como se obtuvo de la ecuación (6-71), obte- 


nemos 
K=[0 0 0 1][A:GA:G.HA:G6*A]" 4(G) 
donde 
$(G) = G* 
Por lo tanto, 
0001 P4.0 1 0o of 
> 0011 0 0 1 0 
K=(0 0 0 1] 0 1 1 0.99 —0.12 —0.01 1 1 
1000 0 0 0.0 
0 0 0 ijf -0.12 -0.13 099 1 
= 10. 0.01) 0.01 —1 1 0O|| -0.1188 -—0.1299 0.86 0.99 
E -1 1 0 Ol| -0.1032 -—0.1274 0.7301 0.86 
1 0.0 off 0 0 0 0 


= [-0.12 0.13 0.99 1] 


La ecuación (6-197) da la matriz K. 


(6-197) 


La constante de ganancia integral deseada K, y la matriz de ganancia de realimentación del estado 


K, se obtienen de la ecuación (6-193). Si observamos que 


-1 1 0/0 

Sh E|- 0 Si -Po 
CG ¡CH -0.12 -0.01 0/1 
0 0.5 110 


es no singular (para ver esto, utilice las operaciones de renglones y columnas, y convierta la matriz en 


una triangular), obtenemos 
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maik = pk + oi SE 


-1 1 0:0 
aña E a o -1 10 
= [-0.12 =0:13 0920 001 01 
ü 05 Tto 

-1 -4 05% 

=[-0.12 -0.13 099:2]) -4 0% 
= [-0. 13 09932] 0 ko 
zoa Ti a 


= [-0.12 0.3233 2:0.6667] 
De la ecuación (6-198) obtenemos la constante de ganancia integral K,: 
Kı = 0.6667 = 3 


La matriz de ganancia de realimentación del estado K, está dada por 


K = [-0.12 0.3233 2] 


467 


(6-198) 
(6-199) 


(6-200) 


Cómo determinar la salida v(k). A continuación determinemos la salida y(A). En la ecuación 


(6-196), tenemos que 
x(k) 
y(k) = Cx(k) = [0.5 1 OJ| x(k) 
x(k) 


Para obtener la salida v(k). primero determinaremos el vector del estado x(4) y la señal v(k}. De la figura 


6-18, 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
v(k) = v(k — 1) + r(k) — y(k) 
u(k) = —-Kox(k) + Kıv(k) 
Por lo tanto, de las ecuaciones (6-201) y (6-204) obtenemos 
x(k + 1) = Gx(k) + Hu(k) 
= (G — HK,)x(k) + HK, v(k) 
Asimismo, de las ecuaciones (6-202). (6-203) y (6-205) 
vík + 1) = v(k) + r(k + 1) — y(k + 1) 
= v(k) + r(k + 1) —- Cx(k + 1) 
= v(k) + r(k + 1) — C[(G — HK>)x(k) + HK, v(k)] 
= (CG — CHK2)x(k) + (1 — CHK,)v(k) + r(k + 1) 


Combinando las ecuaciones (6-205) y (6-206), resulta 


xXk +1) | G-HK, | HK, x(k) 0 
pe] I e e e ; [$a KE 
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(6-205) 


(6-206) 


(6-207) 
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x(k + 1) 0 1 0 0lx(k) 0 
xk +1)|_[0 0 1 0|| xk) 0 
xk + 19 To y -1 3/0) | o ETD (6-208) 
v(k +1) 0 -¿ -1 1] v(x) 1 


Dado que la entrada de comando r(k) es de escalón unitario, tenemos que 
r(k)=1, k=0,1,2,... 


Supongamos que el estado inicial es 


x1(0) a 
xo(0) | _ b 
x3(0) c 
v(0) d 
donde a, b, c y d son arbitrarios. Entonces, de la ecuación 
x(1) 0 1 0 Ojja 0 b 
x(1)|_j0 0 1 Ojj E 0 [1 = c 
x(1) 0 -i -1 ¿ic 0 =1b—c+d 
v(1) 0 -+ -1 1|d 1 =db=c+d+1 
De manera similar, 
x1(2) c 
x2(2) | _ lb -c+2d 
xa(2) a 
v(Q) =1b -łc +id +2 
x1(3) =1b=c+3d 
x(3) | _ 3 
x3(3) 3 
7 v(3) 3 
ba 3 
xAk)[_15 =- 
x(k) | 7 ¿| k=4,5,6,... 
| v(k) 3 
La salida y(k) se obtiene como sigue: 
x1(0) a 
y(0) =[0.5 1 0J|xx(0)| =[0.5 1 OJ|b|=%a+b 
xa(0) c 
Del mismo modo, y(1)=łib+c 


y(2) = -3b - 3c + 2d 
y(3) = -1b-ic+id+2 
y(k)=1, k=4,5,6,... 
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u(k) = —K,x(k) + K, v(k) 


= -[-0.12 0.3233 2]| 3| + G)G) = 0.08670 


WIN WIN wN 


donde k = 4. 5. 6... . En vista de que u(£). para 1 > 47 (donde 7 es el periodo de muestreo). es constante. 
en la salida no existe oscilación entre muestras. Entonces. la respuesta del sistema tiene oscilaciones 
muertas. 

Observe que la salida v(4) llega a la unidad en cuatro períodos de muestreo como máximo. y que 
se queda ahí en ausencia de perturbaciones O de nuevas entradas de comando. [Vea. por ejemplo. la 
secuencia de respuesta escalón unitario de muestra que aparece en la figura 6-20a).] Bajo condiciones 
iniciales especiales. por ejemplo. a=b=c=0 y d= 1. la salida alcanza la unidad en tres períodos de 
muestreo y se queda ahí. es decir. MA) = 1 para k = 3. 4. 5... . [Véase la figura 6-205).] 


Diseño del observador de estados. A continuación. diseñaremos un observador de estados para 
el sistema. En vista de que la salida de la planta v(k) es medible. diseñemos un observador de orden 
mínimo. Supongamos que deseamos la respuesta con oscilaciones muertas. En el sistema presente. la 


x, (0) 1 

x2(0) = -0.5 

x; (0) 0 
v(0) 1 


ylk) =0.5x, (k) + x2[k) 





(a) 


yik) =0.5x; (k) + x,1k) 





(b) 


Figura 6-20 Secuencias de respuesta escalón unitario de muestra para el sistema de seguimiento, con realimentación del 
estado actual (medida) y control integral diseñado en el ejemplo 6-13. 
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matriz de salida C está dada por 


Cc=[0.5 1 0] 
Para modificar la matriz de salida C [0.5 1 OJa[! 0 0], hagamos la siguiente transformación: 
x(k) = Té(k) (6-209) 
donde 
0 0 1 
T=|1 0 -0.5 (6-210) 
0 1 0 
Observe que 
0.5 1 0 
T'=|0 0 1 (6-211) 
1 0 0 
Entonces, las ecuaciones de estado de la planta se convierten en 
ai z (6-212) 
E(k + 1) = T’ GTE(k) + T~ Hu(k) 
y(k) = CTE(k) (6-213) 
donde 
0.5 1 0 0 1 ojo 0 1 
T'GT=|0 0 1 0 0 1111 0 -0.5 
1 0 0|¡-0.12 -0.01 1f10 1 0 
0.5 1 -0.25 A 
=|-0.01 1 -0.115|=G 
1 0 -0.5 
0.5 1 0|[0 0 a 
T'H=|0 0 1j0|=|1|=H 
1 0 0111 0 
0 0 1 
CT=¡0.5 1 0j1ı1 0 -05|=[1 0 0]=C 
0 1 0 
Las ecuaciones de sistema transformadas son las siguientes: 
Sk + 1D] [05:11 -025 ([é(k)] [0 
Ek +1) | =| -0.011 1 0.115 || £(k) | + | 1 fu(k) (6-214) 
E(k +1) 1:0 —0.5 Ek) 0 
Ek) : 
y(k) = [130 0]| Ek) Ai 
&(k) 


Dado que sólo se puede medir una variable de estado. necesitaremos observar dos de ellas. Por lo tanto. 
el orden del observador de orden mínimo es 2. De las ecuaciones (6-138) y (6-114), tenemos que 
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Go e o. [kelu —0.25] 
e2 


ke, —0.115 + 0.25k., 
-0.5 + 0.25k., 


La ecuación característica del observador es 


2 -1+ko 0.115 -—0.25k., 
ke z + 0.5 = 0.25ke, 


(z = 1 + kea)(z + 0.5 — 0.25k.,) — k..(0.115 — 0.25k.,) 
= 2 + (ke, - 0.25ko, — 0.5)z + (0.Sk., + 0.135k., — 0.5) 
=0 (6-216) 








|zI > Gu + K. Gas] fa 


Dado aue aueremos una respuesta con oscilaciones muertas. la ecuación caracteristica deseada es 
2 


Por lo tanto, es necesario que 
ke, — 0.25k.,- 0.5 = 0 
0.Sk., + 0.135k., -0.5 = 0 


Resolviendo estas dos ecuaciones simultáneas en función de ka y ka. tenemos 


a de E oe (6-217) 
ko, 0.9615 

Control integral con observador de estados. Hasta ahora hemos considerado un problema de 
diseño en el cual las variables de estado observadas se realimentan en un lazo menor. y en el lazo princi- 
pal se utiliza un controlador integral. 

En la parte del diseño de la ubicación de polos, hemos utilizado un estado real en vez de un estado 
observado. A continuación obtendremos las ecuaciones de sistema para el caso en el que se utilizan el 
controlador integral y el observador de estados. 

El uso del estado observado X (k). donde X (k) = TË(k ). modifica la señal de control w(k). en el 
control con realimentación del estado, como sigue. En la ecuación (6-204) tenemos 


u(k) = —K¿K(k) + K,v(k) = -K:TE(k) + K, v(k) (6-218) 
Definamos 


E(k) — E(k) = e(k) 


Entonces. la ecuación (6-218) se puede escribir como sigue: 


u(k) = —K¿TE(K) + Ki v(k) + K¿Te(k) (6-219) 
que puede expresarse como 
&(k) 
u(k) = [-0.3233 -2 0.2817]| &(k) 
Ex) 
elk) 
+ 2y(k) + [0.3233 2 -—0.2817]| e(k) (6-220) 
elk) 
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Sustituyendo la ecuación (6-220) en la ecuación (6-214), obtenemos 


Elk +1) 0.5 1 —0.25 || &(k) 
&lk+1i)j=|-3 -1 4 Ek) 
Ek +1) 1 O —0.5 || &(k) 
0 0 0 0 elk) 
+| 2 |v(k) + | 0.3233 2 -0.2817 || e(k) (6-221: 
0 0 0 0 elk) 


Asimismo. se puede modificar la ecuación (6-206) para obtener 


v(k + 1) = -(CGT — CHK: T)Ẹ(k) + (1 - CHK, )v(k) + r(k + 1) 


es decir. 


Ek) 
v(k + 1) =-[0.5 1 -0.25]| Ek) | + v(k) + r(k +1) (6-2221 
Ek) 


Si nos teterimos a la ecuación (0-130), y observamos que E¡(k) = U. es posible dar la dinamica Ze 


error del observador mediante 
ek + 1) IÂ z A elk) 
bee + e] o Gal E) 


Y, por lo tanto. 


0.2596 0.0701 || ek) (6-223; 
-0.9615 -0.2596 || e(k) 


(6-223) en una ecuación de estado. 


0 
esk + 1) 0 
Si combinamos las ecuaciones (6-221). (6-222) y 


&lk +1) 0.5 1 -025 0 0 0 0 ¿(k) 
Ek +1) -} -1 1 2 0.3233 2 0.2817 || &(k) 
Ek +1) 1 0 -05 0.0 0 0 &lk) 
v(k +1) |=|-0.5 -1 0.25 1 0 0 0 v(k) 
elk +1) 0 0. 0 01 0 0 elk) 
e(k +1) 0 0 0 00 0.2596 0.0701 || ex(k) 
es(k +1) 0 0. 0 00 0.9615 —0.2596 || ex(k) 
0 
Q 
0 
+11 ir(k +1) (6-224) 
0 
0 
0 
La salida de la planta y(k) puede ser 
Ek) 
y(k)=[1 0 0]| dk) | = &(k) (6-225) 
&lk) 


Se puede demostrar que para la entrada de comando escalón unitario, la respuesta del sistema bz : 
una condición inicial arbitraria, 
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&(0) 
&(0) 
&(0) 
v(0) | — 
€(0) 
e2(0) 
es(0) 


requiere de por lo menos seis períodos de muestreo para completarse. (Es decir. la salida llega a la unidad 
como máximo en seis períodos de muestreo, y después se queda ahí en ausencia de perturbaciones y 
nuevas entradas de comando.) 

Observe que, como ya vimos, si el estado real puede ser realimentado. el sistema requiere como 
máximo de cuatro períodos de muestreo para completar la respuesta escalón unitario. [En el caso en que 
É(0) = 0, &(0) = 0, E(0) = 0, y (0) = 1, el sistema sólo requiere de tres períodos de muestreo para 
completar la respuesta escalón unitario.] Sin embargo, si se utiliza el observador de estados. el tiempo de 
respuesta aumenta, Si se utiliza el observador de orden mínimo (en este caso de segundo orden). el 
sistema requiere como máximo de seis períodos de muestreo, para completar la respuesta escalón unita- 
rio. [Vea, por ejemplo, la secuencia de respuesta escalón unitario de muestra. que aparece en la figura 6- 
21a).] Esto significa que, en casos especiales, el tiempo de respuesta es mucho más corto. 

Por ejemplo, si las condiciones iniciales son ¿,(0) = 0, £(0) = 0, &(0)=0, 10)= 1, €,(0)=0. y ex(0)=0, 


De oa sca 





yik) 


E, (0) 0 
E2 (0) 0 
E (0) 0 

viO) |=] 1 
€, (0) 0 
€2 10) 0. 
ez (0) 0 


5 


y(k)=E,1k) 





(a) 


¿, (0) 

£ (0) 

£, 10) 
v(0) |= 

€, (0) 

€, (0) 

€; (0) 


000-000 





yik) = E, (k) 


{b} 


Figura 6-21 Secuencia de respuesta escalón unitario de muestra para el sistema de seguimiento con 
una realimentación del estado observado y un control integral diseñado en el ejemplo 6-13. 
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entonces, para completar la respuesta escalón unitario. el sistema sólo requiere de tres períodos de muestreo. 
Véase la figura 6-21(b). 


PROBLEMAS DE EJEMPLO Y SOLUCIONES 


Problema A-6-1 


La definición de controlabilidad que se da en la sección 6-2 no es la única que se usa en los libros. A 
veces se utiliza la siguiente definición: un sistema de control se define como de estado controlable si. 
dado un estado inicial arbitrario x(0), es posible traer el estado al origen del espacio de estados en un 
intervalo de tiempo finito, siempre que el vector de control no tenga restricciones (no acotado). 

El concepto de alcanzabilidad, similar al de controlabilidad, se encuentra en los libros y se utiliza 
en la forma siguiente: un sistema de control se define como alcanzable si, al empezar desde el origen de! 
espacio de estados, el estado puede ser llevado a un punto arbitrario en el espacio respectivo en un 
período finito, siempre que el vector de control no esté restringido (no acotado). 

Demuestre que el sistema 


x(k $ 1) a 0.0 x(k) 0 
p + n] È JE TPO 
es controlable (en el sentido definido en este problema). pero no alcanzable. 


Solución Si se reescribe la ecuación de estado del sistema, se obtiene 
x(k+1)=0 
x(k + 1) = —x1[k) + x(k) + u(k) 
Empezando a partir de un estado arbitrario resulta 
x(1)=0 
x2(1) = —x1(0) + x2(0) + u(0) 


Por lo tanto, al seleccionar 


u(0) = x,(0) — x2(0) 


el estado puede ser llevado al origen en un solo paso. Por lo tanto el sistema es controlable en el sentido 
definido en este problema. 
Si el estado empieza a partir del origen, tenemos 


x(1) =0 
x(1) = —x1(0) + x2(0) + u(0) = —0 +0 + u(0) = u(0) 


Aunque x,(1) puede ser llevado a un punto arbitrario en un paso, x, (1) no puede ser controlado. En 
consecuencia. el sistema no es alcanzable. 

Observe que el sistema presente no es controlable en el sentido definido en la sección 6-2 (donde 
el estado terminal es un punto arbitrario en el espacio de estado incluyendo el origen), porque no se 
satisface la condición de rango requerida. como muestra lo siguiente: 

0 0 
1 


|< 


rango [H: GH] = rango| 
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Como se ve en este problema, controlabilidad y alcanzabilidad (ambas definidas en este proble- 
ma) son distintas. Sin embargo, si la matriz de estado G es no singular. entonces la controlabilidad 
completa del estado. en el sentido definido en este problema, y la alcanzabilidad completa dei estado, 
significan lo mismo. Es decir. para el sistema con una matriz no singular G. la controlabilidad completa 
del estado significa la alcanzabilidad completa. y viceversa, 


Problema A-6-2 
Considere el sistema de estado completamente controlable definido por 
x(k + 1) = Gx(k) + Hu(k) 


donde 


_|1 0.6321 _ | 0.3679 
ea E a dd Licda 


El período de muestreo es de 1. La señal de control 1(£) es no acotada, es decir 
-> =< u(k) = oo 


entonces un estado inicial arbitrario x(0) puede ser traido al origen como máximo en dos periodos de 
muestreo. utilizando una señal de control constante por intervalos. 

Deduzca la ley de control para transferir un estado inicial arbitrario x(0) al origen. Determine la 
región en el espacio de estados en el cual el estado inicial puede ser llevado al origen en un período de 
muestreo. 

Si la magnitud de (A) está acotada. entonces algún estado inicial no podrá ser transferido al origen 
en dos períodos de muestreo. (Pudieran requerirse de dos, tres, cuatro o más de tales períodos.) Suponga 
que 


lu(k) = 1 


Determine la región de los estados iniciales en el plano xx, que pueden ser transferidos al origen en uno 
y en dos períodos de muestreo, respectivamente, al usar la señal de control acotada M4) < 1. 


Solución 


Para el caso en que ulk) es no acotada. En vista de que el sistema es del segundo orden, se necesitan 
como máximo dos períodos de muestreo para transferir cualquier estado inicial x(0) al origen. Al obser- 
var que 


x(1) = Gx(0) + Hu(0) (6-226) 
x(2) = 0 = Gx(1) + Hu(1) = G?x(0) + GHu(0) + Hu(1) 


y que G es no singular, se obtiene 


x(0) = -G"'Hu(0) - G? Hu(1) (6-227) 
Sustituyendo la ecuación (6-227) en la ecuación (6-226), 
x(1) = -GHu(1) (6-228) 


Observa 


GH= 1 —1.7181 || 0.3679 | _ | -0.7181 
T40 2.7181 j| 0.6321 1.7181 


G?H = 1 —6.3881 || 0.3679 | _ | -3.6700 
~ {0 7.3881 || 0.6321 4.6700 
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De las ecuaciones (6-227) y (6-228) se obtienen las dos siguientes: 
xi(0) | _ _| 0.7181 _ | -3,6700 
Esc] = | oya 0) | L 1) cis 
x(1)|_ | —0.7181 (6-230 
E j | as o 
Si se combinan tas ecuaciones (b-24Y) Y (0-23U), Se tiene 
xi(0) x1(1) E 0.7181 3.6700 || u(0) u(1) 
x(0) x2(1) —1.7181 —4.6700 || u(1) 0 
que puede modificarse a 
u(0) u(1) z —1.5820 -1.2433 || x,(0) x1(1) (6-231: 
ul) 0 0.5820 0.2433 || x2(0) x2(1) 
de la cual se obtiene 
u(k) = —-1.5820x1(k) — 1.2433x2(k), k=0,1 


Esta ecuación da la ley de control requerida. Con esta ley cualquier estado inicial x(0) puede transferirse 
al origen cuando mucho en dos períodos de muestreo. 

A continuación se determinarán los estados iniciales a partir de los cuales el estado del sistems 
puede ser transferido al origen en un solo período de muestreo. Al igualar x(1) a 0 en la ecuaciór. 
(6-226), se obtiene 


x(1) = 0 = Gx(0) + Hu(0) 


de lo cual resulta 


x(0) = -G *Hu(0) 


(0) | _ | 0.7181 a 
Eso] z MATO (6-232 


De la ecuación (6-232) se encuentra que si el estado inicial está sobre la línea 
1.7181x,(0) + 0.7181x2(0) = 0 


entonces puede ser transferido al origen en un solo periodo de muestreo. (De lo contrario, necesitamos d+ 
dos períodos para traer el estado inicial al origen.) 


es decir 


En el caso en que u(k) está acotada, es decir lu(k)| S 1. Si se necesita x(1) = 0, entonces, a partir de iż 
ecuación (6-232) se tiene 


x1(0) = 0.7181u(0), x(0) = -1.7181u(0) 
Dado que |u(0)| < 1, 
|x1(0)| = 0.7181, Ix2(0)| = 1.7181 
Por lo tanto, si el estado inicial está sobre el segmento de recta 
1.7181x,(0) + 0.7181x.(0) = 0, 0.7181 = x,(0) = 0.7181 


puede ser llevado al origen en un solo período de muestreo. Este segmento aparece en la figura 6-22 
como AOB. 
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Región 
correspondiente 
a dos periodos 


Región (linea 
de muestreo sien y 


para un período 
/ de muestreo 
rá 





Figura 6-22 Regiones a partir de las cuales los estados iniciales pueden ser llevados al origen en uno o dos periodos de 
muestreo, cuando (k) está acotada de forma que Ju(x)] < 1. 


Si se necesita que x(2) = 0. entonces de la ecuación (6-231) se obtiene 
u(0) = —1.5820x,(0) — 1.2433x2(0) 
u(1) = 0.5820x,(0) + 0.2433x2(0) 
Como ¡MO! 1 y Ju) < 1, se obtienen las siguientes cuatro relaciones: 
1.5820x,(0) + 1.2433x2(0) = 1 
1.5820x:(0) + 1.2433x,(0) = —1 
0.5820x,(0) + 0.2433x,(0) = 1 
0.5820x,(0) + 0.2433x,(0) = —1 


La región limitada por estas cuatro desigualdades aparece en la figura 6-22. Si el estado inicial ocurre en 
esta región. excepto en la linca AOB. puede ser transterido entonces al origen en dos periodos de muestreo. 
Si el estado inicial está fuera de esta región. llevar el estado al origen tomará entonces más de dos 


periodos. 
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Problema A-6-3 
Considere el sistema de función de transferencia pulso siguiente: 
Y(z)_ 2 "(1+0.877)) 


U(z) 1+1.32* +0.42 7? 
Una representación en el espacio de estados para este sistema puede estar dado por 





b H A 7 È? EEA T [lugo (6-233) 
y(k) = [0.8 E (6-234) 
Para el mismo sistema se puede dar una representación en el espacio de estados diferente mediante 
e E a e ao dE 
y(k) = [0 aa (6-2361 


Demuestre que la representación en el espacio de estados definida por las ecuaciones (6-233) + 
(6-234) da un sistema que es de estado controlable, pero no observable. Demuestre, por otra parte, que la 
representación en el espacio de estados definido por las ecuaciones (6-235) y (6-236) da un sistema que 
no es de estado completamente controlable, pero sí observable. Explique lo que causa la diferencia 
aparente en controlabilidad y observabilidad del mismo sistema. 


Solución Considere el sistema de control en tiempo discreto definido por las ecuaciones (6-233) + 
(6-234). El rango de la matriz de controlabilidad 


mom =[3 4, 


es 2. Por lo tanto, el sistema es de estado completamente controlable. El rango de la matriz de observabilidad 


: 0.8 -0.4 
*: CC *] = 
[C* : G*C*] E 3 
es 1. De modo que el sistema no es observable. 
A continuación, considere el sistema definido por las ecuaciones (6-235) y (6-236). El rango de la 


matriz de controlabilidad 


(H: GH] = a Sel 


1 —05 


es 1. Por lo tanto, el sistema no es de estado completamente controlable. El rango de la matriz de 


observabilidad 
A 0 1 
* GRO] = 
[C*:G*C+*] E a 


es 2, En consecuencia, el sistema es observable. 
La diferencia aparente en controlabilidad y observabilidad del mismo sistema está causada por e. 
hecho de que el sistema original tiene una cancelación polo-cero en la función de transferencia de pulse 


Y(z) 2 z +0.8 z z + 0.8 
U(z) 2?+1.32+0.4 (z +0.8X(z + 0.5) 





www.FreeLibros.me 


Capítulo 6 Problemas de ejemplo y soluciones 479 


Si ocurre una cancelación polo-cero en la función de transferencia pulso, entonces la controlabilidad y la 
observabilidad varian. dependiendo de cómo se escojan las variables de estado. 

Note que para que sea de estado completamente controlable y completamente observable, el siste- 
ma de función de transferencia pulso no debe tener ninguna cancelación polo-cero. 


Problema A-6-4 


Considere el sistema de control definido por 


x(k + 1) = Gxík) + Hu(k) (6-237) 


y(k) = Cx(k) + D (6-238) 
donde 
x(k) = vector de estado (de dimensión n) 
u(k) = señal de control (escalar) 


v(k) = señal de salida (escalar) 

G = matriz den x n 

H = matriz de n x 1 

C = matriz de 1 x n 

D = escalar (constante) 
Como se indicó mediante la ecuación (5-60), la función de transferencia de pulso F(=) puede darse como 
sigue: 

F(z) = CG1-G)'H+D 


Demuestre que si el sistema es de estado completamente controlable y completamente observable, en- 
tonces en la función de transferencia pulso F(=) no hay cancelación polo-cero. 


Solución Suponga que existe una cancelación polo cero en la función de transferencia de pulso, aun- 
que el sistema sea de estado completamente controlable y completamente observable. Considere la si- 
guiente ecuación de identidad: 


I ofz1-6 n] [z1-G A 
C(21-G)' 1 -c D| 0 F(z) 


Al tomar el determinante del primer miembro de la ecuación, e igualarlo al del segundo miembro, se 





obtiene 
z21-G H 
AS Ël- 121 - airo) 
es decir, 
A -G H 
- D 
F(2) = — A 
a) lz1 — G| 
Los polos de F(z} son las raíces de |zI — G] = 0, y los ceros de F(=) son las raíces de 
z21-G H 
z= 6-239) 
| -C D y ( 
Ahora suponga que ocurre una cancelación polo-cero. Supongamos que z = =, es un polo de F(z) y 
también es un cero de F(z), por lo que se presenta cancelación. Entonces : ==, es una raiz de [-1- G]=0. 


También es una raíz de la ecuación del determinante dada por la ecuación (6-239). 


www.FreeLibros.me 


480 


Ubicación de polos y diseño de observadores Capítulo 6 


E 


donde v es un vector de dimensión n y w es un escalar. de forma que 


az 1-GiH[v]|_|0 4 
pst <> 


Si w 2 0. entonces de la ecuación (6-240) tenemos 


Esto significa que existe un vector 


es decir. 
(G - zi Dv = Hw (6-241) 


Dado que z =z, es una raíz de la ecuación característica, el polinomio característico p(=) de G se 
puede escribir como sigue: 


elz) = (z — z)ó(z) 
o sea 
d(G) = (G - z 1)$(G) = ó(GAG - 21) = 0 
De la ecuación (6-241) se tiene 
H(G)v = $(G)(G — zi I)v = $(G)Hw = 0 


Por lo tanto. 


H(G)H = 0 
En vista de que b2) es un polinomio de grado n — 1, el hecho de que $(G)H =Q significa que el vector 
G"! H se puede expresar en función de G, GH, . . . , G” ? H. Por lo tanto, 
rango [H: GH | + | GTH] <n 


Esto contradice la suposición de que el sistema es de estado completamente controlable. Por lo tanto. si 
el sistema es de tal estado, entonces en la función de transferencia pulso no existe cancelación de polo- 
cero. 

Ahora, refiriéndonos a la ecuación (6-240), si w = 0 y v > 0 se tiene entonces 


(z,1- G)v=0 (6-242: 
Cv=0 (6-243: 

De la ecuación (6-243), 
v*C*=0 (6-244: 


De la ecuación (6-242), 
v*G* = 7 v* 
Por lo tanto, 
v*G*C* = z y*C* =0 
donde hemos utilizado la ecuación (6-244). En forma similar, 


v*(G*) C* = v*G*G*C* = 7, v*G*řC* = z? v*C*=0 
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haa 


y GI C* = z v*C*=0, k=1,2,3,...,n 


Por lo tanto, 


es decir, 


Lo anterior contradice la suposición de que el sistema sea completamente observable. Entonces, si el 
sistema es de tal clase no existe cancelación polo-cero. 

Esto comprueba que si el sistema es de estado completamente controlable y completamente obser- 
vable, entonces en la función de transferencia pulso F(2) no existe cancelación polo-cero. 


Problema A-6-5 


Considere el sistema de estado completamente controlable 
x(k + 1) = Gx(k) + Hu(k) 
Defina la matriz de controlabilidad como M: 


M = [(H:GH:---:G"*H] 
Demuestre que 


0.0 0 -a 
1 0 > 0 -ani 
M“’GM=|0 1 +++ 0 -an2 (6-245) 
00- 1 -a 
donde a, 4», . . . , a, son los coeficientes del polinomio característico 


[zI — G| = z” + az” + ERT + An-12 + 4, 


Solución Consideremos el caso donde n = 3. Se demostrará que 


0 0 -a 
GM=M|1 0 -a (6-246) 
0 1 —a, 


El primer miembro de la ecuación (6-246) es 
GM = G(H: GH: GH] = [GH : GH: G*H] 


El segundo miembro de dicha ecuación es 


0.0 — d3 
[H:GH:GH]|1 0 -a,|=[GH:G*H:-a,H - aGH-aGH)  (6-247) 
0 1 41 


El teorema de Cayley-Hamilton dice que la matriz G satisface a su propia ecuación característica, es 
decir, 
G” +aG7*++::+4,-1G+a,1=0 


Para n = 3 se tiene G+aG+a,G+a1=0 (6-248) 
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Al usar la ecuación (6-248), la tercera columna del segundo miembro de la ecuación (6-247) se convierte 
en 
—asH — a GH - a; G°H = G'H 


Por lo tanto, la ecuación (6-247), que es el segundo miembro de la ecuación (6-246), se convierte en 


0 0 ~a3 
[H : GH: G° H] 1 0 ~a = [GH: GH: G°’ H] 
0 1 —41 
Así se ha demostrado que la ecuación (6-246) es cierta. Por lo tanto, 
0 0 —â3 
M"GM=|1 0 -~a 
0 1 41 


La deducción anterior se puede extender fácilmente al caso general de cualquier entero positivo n. 
Problema A-6-6 


Considere el sistema de estado completamente controlable 


x(k + 1) = Gx(k) + Hu(k) 


Defina 
M= [H:GH:---:G"?H] 
y 
Amr an2 co ay 1 
An-2 Gn-3 1 0 
W= : : 
ar 1 0 0 
1 0 0 0 
donde las a, son los coeficientes del polinomio característico 
lz1 — G| =z" + az’ +--+ aniz +0, 
Defina también 
T = MW 
Demuestre que 
0 1 0 “.. 0 0 
0 0 1 <- 0 0 
T'GT=| : A : : | TUH=|: 
0 0 0 ... 1 0 
an Mar Ta ` TA 1 
Solución Consideremos el caso donde n = 3. Se demostrará que 
0 1 0 
TGT=(MW)'"G(MW)=| 0 0 1 (6-249: 
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Refiriéndonos al problema A-6-5, se tiene 


0 0 43 
(MW) * G(MW) = WM" GM)W =W"11 0 -a |W 
0 1 41 
Por lo tanto, la ecuación (6-249) se puede reescribir como sigue: 
0 0 -a 0 1 0 
w1 0 -—a|W=| 0 0 1 
0 1 =41 7d3 “a -â 
En consecuencia, debemos demostrar que 
0.0 43 0 1 0 
10 —a¡[W=W| 0 0 1 (6-250) 
0 1 41 74d —d2 “A 
El primer miembro de la ecuación (6-250) es 
0 0 -ala a 1 -43 0 0 
1 0 ~az a 1 0|= 0 a 1 
0 1 —al1 0 0 0 1 
Y el segundo miembro 
a a 1 0 1 0 -æ 0 0 
a 1 0 0 0 1 =] 0 a 1 
1 0 0 =4d3 7d “üi 0 1 0 


Es claro que la ecuación (6-250) es cierta. Por lo tanto, se ha demostrado que 


A continuación, se demostrará que 


0 
T"H=|0 (6-251) 
1 


Observe que la ecuación (6-251) se puede escribir de la forma: 
0 0 

H=T|0|=MW¡0 

1 1 


Esta última ecuación puede verificarse fácilmente, debido a que 


0 0 az a 1/0 
T| 0| = MW] 0 = [H: GH: G’ H] a 1 0j¡0 
1 1 1 0 0J|1 
1 
= [H: GH: G?’H]| 0 | = H 
www.Fre 8 ros.me 


484 


Ubicación de polos y diseño de observadores Capítulo 6 
Por lo tanto, 
0 
T*H=]|0 
1 


La deducción anterior puede extenderse con facilidad al caso general de cualquier entero positivo n. 


Problema A-6-7 


Considere el sistema siguiente: 


x(k + 1) = Gx(k) + Hu(k) 


donde 
0 1 0 0 
G=]| 0 0 1 j, .H=|0 
di ~a —41 1 


Observe que el sistema está en la forma canónica controlable. 
Defina la matriz de transformación T como sigue: 


T = MW 
donde 
M = [H:GH:G*H] 
4 a a 1 
W= a1 1 0 
1 0 0 


Demuestre que si el sistema está en la forma canónica controlable, entonces T = I. En consecuencia, si el 
sistema está en la forma canónica controlable se tiene que 


a a 1 
M`! =W= di 1 0 
1 0 0 
Solución En vista de que 
0 0 1 
M=|0 1 —-4a; 
1 -a -a +a 
se tiene 
0 0 1 a a 1 100 
T=MW=|0 1 =á a 1 0|=|0 1 0|=I 
Por lo tanto, 1 ~a, -a +a ||1 0 0 00 1 
a a, 1 
M`! =W= al 1 0 
1 0 0 
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Problema A-6-8 


Considere el sistema completamente observable 
x(k + 1) = Gx(k) 
y(k) = Cx(k) 


Defina la matriz de observabilidad como N: 


Demuestre que 


0 1 0 0 
0 0 1 ». 0 
N*G(N*) t=] : ; : ; 
. . E 52 
0 0 0 NS | 5200 
Tn Tan- Tn te: 41 
donde a}, a», . . . , a, son los coeficientes del polinomio característico 


izl-G|=2 + az"! +- + 45-12 + 4, 


Solución Consideremos el caso donde n = 3. Entonces la ecuación (6-252) se puede escribir en la 
forma 


* *y1l= 
N*G(N*) 0 0 1 (6-253) 
=4d3 — da ~d 
La ecuación (6-253) se puede volver a expresar como 
0 1 0 
NG=| 0 0 1 [N* 5290) 


Demostraremos que la ecuación (6-254) es cierta. El primer miembro de la ecuación (6-254) es 


C CG 
N*G = | CG |G = | CG? 
CG? CG? 
El segundo miembro de la misma es 
0 1 0 0 1 0 Cc CG 
0. 0 1 N*=]; 0 0 1] CGj= CG? 
+43 042 —41 +43 4 -lı CG? —a3C — 2 CG — 41 CG? 


El teorema de Cayley-Hamilton dice que la matriz G satisface su propia ecuación característica, es decir, 
para el caso de n= 3, 


G+aG?+aG+al=0 


Por lo tanto, 


-41, CG? — a CG — aC = CG? 
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En consecuencia. 


0 1 0 CG 
0 0 1 |N* =| CG? 
743 42 —41 CG? 


Se ha demostrado así que la ecuación (6-254) es cierta. Por lo tanto. 


0 1 0 
N*G(N*)*=| 0 0 1 
=a; 42 4; 


La deducción aquí presentada puede extenderse al caso general de cualquier entero positivo n. 
Problema A-6-9 


Considere el sistema de estado completamente controlable y completamente observable, dado por 
x(k + 1) = Gx(k) + Hu(k) (6-255) 
y(k) = Cx(k) + Du(k) (6-256) 
Defina 


Gn-1 An-2 `° Q, 1 

An-2 Gn-3 1 0 

W=| : : p ai 
a, 1 0 0 

1 0 0. 0 


donde las a, son los coeficientes del polinomio característico 
zl-Gl=2"+4127 +- +45-12 +a, 


Defínase también 


Q = (WN*) ~? 
Demuestre ahora que 
0 0 --- 0 —a, 
1 TE | MIES PA 
QUGQ =|f0 1 >- 0 -an2 
0 0 = 1 =i 
CQ=[0 0 --* 0 1] 
bn — An bo 
07H AÑ Bra An -1b0 
b,-a; bo 
donde las b; (k= 0. 1.2, ....n) son los coeficientes que aparecen en el numerador de la función ce 


transferencia de pulso, cuando C(zJ — G)’ H + D se escribe como sigue: 
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boz” + biz? + o...+ Da-12 + ba 


C(z1 = G) H + D s A 
z + az aan a E Va? AA 


donde D = bo. 


Solución Consideremos el caso cuando n = 3. Se demostrará que 


0 0 43 25 
Q7'GQ = (WN)G(WN9)"=|1 0 -a inde 
0 1 41 
Observe que refiriéndonos al problema A-6-8, se tiene 
0 1 0 


(WN*)G(WN*)7 = W[N*G(N*%) JW" =W| 0 o 1 |w” 
7243 7d 4 


Por lo tanto. se necesita demostrar que 


0 1 0 0 0 -a 
W 0 0 1 w” =|1 — (2 
=i —l2 —4di 0 1 4 
es decir 
0 1 0 0 0 -a 
wi 0 0 1j¡=|1 0 -a W (6-258) 
—a} -42 -4; 0 1 -a 
El primer miembro de la ecuación (6-258) es 
0 1 0 a a, 1 0 1 0 -a 0 0 
wj 0 0 1 j=ja 1 Oj 0 0 1 |=]; 0 a 1 
7d3 “a —4; 1 0.0 =g =a —41 0 1 0 
Y el segundo. 
0 0 43 0 0 —a3 22 41 1 743 0 0 
1 0 4 W=!|1 0 42 a; 1 0|= 0 âi 1 
0 1 —a, 0 1 -a41 0 0 0 1 0 


Entonces. la ecuación (6-258) es cierta. Por lo tanto. se ha demostrado que la ecuación (6-257) también 
lo es. 
Ahora se demostrará que 


CcQ=][0 0 1] 
es decir. 
C(WN*)”! = [0 0 1] (6-259) 
Observe que 
4d 41 1 Cc C 
[0 0 1(WN*)=[0 0 lija, 1 ON CG|=[1 0 O CG|=C 
1 0 0||CG? CG? 


Por lo tanto. se ha demostrado que 
[0 0 1] = C(WN*)' 
que es la ecuación (6-259). 
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Ahora definamos 


x= Qk 
Entonces la ecuación (6-255) se convierte en 
x(k + 1) = Q *GQKX(k) + Q' Hu(k) (6-260) 
y la ecuación (6-256) en 
y(k) = CQC) + Du(k) (6-261) 
Para el caso de n = 3, la ecuación (6-260) será: 
0 0 -a Y 
Xk+1)=1 0 -a |[Xk) + | yo ju(k) 
0 1 -a Y 
donde 
Ya 
n|=0'H 


Y 
La función de transferencia pulso F(z) para el sistema definido por las ecuaciones (6-260) y (6-261) es 
F(2) = (CQNz1 - Q GQ) 'Q'H + D 


Al observar que 


cQ=[0 0 1] 
se tiene z 0 a ly» 
F(2)=(0 0 1-1 z a R|+D 
0 -1 z+a1 Y 


Note que D = b,. Como 


z 0 a |` 1 z +az +42 —a; ~a3Z 
-1 z a |=- z+a z+ az -az — 4; 
+ + az + 
0 -1 z+4 E arg ara da 1 z z? 
tenemos 
1 M RA 
F(z) = ;——; [1 z z +D 
(2) a ¡ds 
1 


1 nz? + Y2 7 + Ya 
IS TT 
z” + 012% + a22 + 05 
A boz? + (yı +a bo)z? + (Y + azbo)z + (1 + a, bo) 
z? + az? + az + a 
pe boz? ag biz? + bız + ba 
z +a’ + az +a 





Por lo tanto, y, = b, — aibo y, = b,— abo y Y = b; — abo. Se ha demostrado así que 
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Ya bs — as bo 
Q7'H =| Y» |=|b2- azbo 
Y bı — aı bo 


Observe que lo que se ha deducido aquí puede extenderse fácilmente al caso en donde n es cualquier 
entero positivo. 
Problema A-6-10 
Considere el sistema definido por 
z+l 


0d (6-262) 


Refiriéndonos a la sección 6-4, obtenga las representaciones en el espacio de estados para este sistema en 
las tres configuraciones siguientes: 


1. Forma canónica controlable 
2. Forma canónica observable 
3. Forma canónica diagonal 


Solución 
1. Forma canónica controlable. Al comparar las ecuaciones (6-262) con la ecuación (6-39), se obtie- 
ne 


a = 1, da = 0.16, bo = 0, bı Pe 1, bz =1 


Por lo tanto, refiriéndonos a las ecuaciones (6-37) y (6-38) resulta 
x(k + 1) = 0 x(k) k 
x(k + 1) | 7 | -0.16 3 xk) u(k) 
A xi(k) 
y(k) ka [1 1.9] 


2. Forma canónica observable. En vista de que a, = 1, a,=0.16,b,=0,b,=1 y b, = 1, refiriéndonos 
a las ecuaciones (6-41) y (6-42), se obtiene que 


(k+1)]_ [o -0.16 || x(k) 
[ns + n = 2 -1 Nans E le (k) 
y(k) = [0 de 


3. Forma canónica diagonal. Observemos que 








E = 


wp 








G(z) = 


zN 0. 2 z +0.8 
Al comparar esta última ecuación con la (6-47) resulta 
qa Br = => $, a: Ba = =3, Pı” —0.2, P2 = —0.8, D=0 


Por lo tanto, escogiendo arbitrariamente a, = a, = l y refiriéndonos a las ecuaciones (6-45) y 


(6-46), resulta 
x(k + 1) pa -0.2 0 x(k) 1 
e + A j | 0 el 4 [i æ 


y% =8 -fz 
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Problema A-6-11 


Considere el sistema con doble integrador 


x((k + 1)T) = Gx(kT) + Hu(kT) 


lr _ [T2 
e-f ih [7] 


y donde T es el período de muestreo. (Vea el problema A-5-16 para la deducción de esta ecuación de 
estado en tiempo discreto correspondiente al sistema con un doble integrador.) Determine la matriz de 
ganancia de realimentación del estado K tal que la respuesta a una condición inicial arbitraria sea con 
oscilaciones muertas. Para el estado inicial 
1 
x(0) = 
o = [1 


determine u(0) y u(T), paraT=0.18s,T=1syT=10s. 


donde 














Solución Definamos 
K = [ka k2] 
Entonces 
T: T 
2=1+ 7% =T +7 ka 
I- G + HK| = 
la | Tk, 2-1+Tk, 
T? 2 
= 2-(2-En 7 74): + 1 +Ex => Tk: 
2 2 (6-263) 
=0 
La ecuación característica deseada es 
z=0 (6-264) 
Por lo tanto, al comparar las ecuaciones (6-263) y (6-264) se obtiene 
2 
2- Tk - Tk=0 
2 
1+ Ea, - Tk =0 
De las cuales resulta 
1 3 
khs k=>p 
Por lo tanto, 
1 3 
ES E a 


A continuación se demostrará que la respuesta a las condiciones iniciales es con oscilaciones 


muertas. Suponga que el estado inicial es 
x1(0) E a 
x2(0) b 
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La ecuación con la realimentación del estado es 


x((k + 1)T) = (G — HK)x(kT) 


es decir, 
1 T 
4 


ee + nni a EA 
x((k + DT) 1 1l xkT) 


Observe que 


tci ii FE 
an]_|2 4 lx0]_| 2 4 fa]_| 2274 
xa T) _1 _1j[x(0) _1  1fjb 1 1, 
T 2 T 2 T? 2 
1 T la + T, 
[aon] 2 2 42T fel 
D|] a _1[)_1,_1,| Lo 
ol 
Por lo tanto, es claro que la respuesta es con oscilaciones muertas. 
Se determinará ahora u(0) y u(T). Note que 
113 
u(kT) = —Kx(kT) = E zhen 
Por lo tanto, 
1 3 pPaj_ 3 
Aa E ap pp 
1 T 
za +-b 
Ud ANA loe 
T? 2T a 1, T 2T 
T 2 
Paraa=1yb= l, se tiene 
1 3 1 1 
==- == 42 
(== zp UD =p 


En particular, para 7=0.1 s, 


u(0) = —115, u(T) = u(0.1) = 105 
Para T= 1s, 


u(0) = —2.5, u(T) = u(1) = 1.5 
Para T= 10s, 
u(0) = —0.16, u(T) = u(10) = 0.06 


Observe que para un valor pequeño del período de muestreo T. se hacen grandes (0) y (7). Al aumentar 
el valor de T se reducen en forma significativa las magnitudes de (0) y de 1.7). 
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Problema A-6-12 
Considere el sistema definido por 
x(k + 1) = Gx(k) + Hu(k) 


donde x(k) es un vector de dimensión 3. Se supone que el sistema es de estado completamente controla- 
ble. Mediante la utilización de la técnica de ubicación de polos, se desea diseñar el sistema con polos en 
lazo cerrado en z = 4,,2= 4, y Z= 3, donde las u, son distintas. Es decir, al usar el control con realimentación 
del estado 


u(k) = —Kx(k) 
se desea obtener 
|zI — G + HK] = (z — 40 — 42) — m) = z? + az? + 022 + œ 
Demuestre que la matriz de ganancia de realimentación del estado K deseada puede darse por 
K=[1 1 18 & E” (6-265) 
donde 
& = (G - mI) H, i= 1,2,3 (6-266) 


Demuestre también que los vectores & son vectores característicos de la matriz G — HK; esto es, £ 
satisface la ecuación 


(G — HK)JE, = uE, ¡=1,2,3 
Solución Definamos 


G=G-HK 
Al usar el teorema de Cayley-Hamilton, G satisface su propia ecuación característica: 
G? + aG? + mG + œl = $(G)=0 (6-2671 
Considere las identidades siguientes: 
I=I 
G=G-HK 


G? = (G — HKP = G? — GHK - HKG 

G? = (G — HKÖ = G? - G’ HK - GHKG - HKG? 
Si se multiplica cada una de las ecuaciones precedentes por az, œz, œ) y ae (siendo a, = 1) en este orden. 
y sumando los resultados, se obtiene 

w1+0G+0G+G6=01+ aG + aG? + G? — a HK 
- œa GHK — a, HKG — G?HK - GHKG - HKG? 

Al observar que el primer miembro de esta última ecuación es cero, esta última ecuación se puede reduci? 
a 


aK + ai KG + KG? 
0 = (G) — [H:GH:G?H] aiK + KG 
K 
De modo que 
www.FreeLibros.me 


Capítulo 6 Problemas de ejemplo y solucione 493 


aK + a, KG + KG? 
a K + KG = [H: GH:G*H]* ¿(G) 
K 


Premultiplicando ambos miembros de esta última ecuación por [0 0 1], se obtiene 


aK + KG + KG? 
[o 0 1 aK + KG =[0 0 1][H:GH:G*H]”' $(G) 
K 


o bien 
K=[0 0 1][H:GH:G*H]' $(G) (6-268) 268) 
que es la fórmula de Ackermann. Observando que 
(G) = G? + a G? + ea G + az 1 
= (G — m D(G — 1¿D(G — u1) 
tenemos 
K=[0 0 1]/H:GH:G*H]*(G — m I(G — n2D(G — pI) 


Mediante la posmultiplicación de ambos miembros de esta última ecuación por é =(G— u, D” H, 


resulta 
Kg, = [0 0 1][H: GH: GH] (G — 1¿D(G — 12D(G — 13D(G - mI)’ H 


=[0 0 1]|[H:GH:G?H] (G — 4¿D(G — 4sDH (6-269) 
Definamos 
(G — m D(G — a2D) = G? + B2G + Bul 
(G — 12D(G - nal) = G? + BG + Bal 
(G — 4¿D(G — m I) = G + BG + Bal 


Entonces la ecuación (6-269) puede escribirse como sigue: 


Ke, =[0 0 1][H:GH:G?H]"(G? + BG + fa 1D)H 


Ba 
=[0 0 1][H:GH:G?*H]*[H:GH:G*H]| g2 


Ba 
=[0 0 1]| Ba|= 1 
Por lo tanto, 1 


Kg, =1 
De manera similar, 


Kg, = 1, Kg, = 1 
En consecuencia, 
K[8 & £]=(1 1 1] 


es decir, 


K=[ 1 18 € 8)” (6-270) 
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La ecuación (6-270) da la matriz de ganancia de realimentación del estado K deseada en términos de É,, 


y E. 


Para demostrar que los £, son vectores característicos de la matriz G — HK, note que 
(G — HK); = (G — HK)(G — 4¡D'H 
= (G — 4¡1+ m;I — HK)(G — m: DH 
= (G — 4¿D(G — ¿DH + (4,1 — HK)(G — 4, 'H 
=H + (u4¿I - HK)JE; 
= H — HK, + m (6-271) 


Como ya se ha demostrado anteriormente, 
K = 1, i = 1,2,3 
Por lo tanto, la ecuación (6-271) se puede simplificar a la forma 
(G — HK)& = p,€,, i = 1,2,3 
Por lo tanto, los vectores £,, €, y €, son vectores característicos de la matriz G — HK correspondiente a los 
valores característicos 4,, H Y 43, respectivamente. 


Problema A-6-13 


Considere el sistema definido por 

x(k + 1) = Gx(k) + Hu(k) 
donde x(k) es un vector de dimensión 3. Se supone que el sistema es de estado completamente controla- 
ble y que se desea respuesta con oscilaciones muertas al estado inicial x(0). (Es decir, los polos en lazo 


cerrado deseados deberán estar en el origen de modo que 4, = y, = 4, = 0.) 
Demuestre que la matriz de ganancia de realimentación del estado K deseada puede darse median- 


te la fórmula 
K=[1 0 0][8 € €)” (6-272) 
donde E =G'H 
Et =G*H 
& = GH 


Demuestre también que los vectores É, son vectores característicos generalizados de la matriz G — HK: 
esto es, que & satisface las ecuaciones 


(G Ea HK), =0 
(G — HK): = Es 
(G — HK)És = £ 


Solución Refiriéndonos a la ecuación (6-268), tenemos 
K=[0 0 1][H:GH: G*H]”* 4(G) 
donde 
d(G) = G? 
Por lo tanto. 
K=[(0 0 1]/[H:GH:G*H] G? (6-273) 
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Posmultiplicando ambos miembros de la ecuación (6-273) por €, = G”' H, se obtiene 
Kg: =[0 0 1][H:GH:G*H]'G'G"'H 
=(0 0 1][H: GH:G*H]*G?H 


0 
=[0 0 1][H:GH:G*H]*(H:GH:G*H] 0 
0 
=[0 0 Y0|=1 
1 


Así que 
Ki, =1 
Posmultiplicando ambos miembros de la ecuación (6-273) por €, = G”? H. resulta 
Kg, = [0 0 1][H:GH:G*H]*G*G"*H 
=[0 0 1][H:GH:G*H] GH 
0 
=[0 0 1][H:GH:G?*H]'[H: GH: GH] A =0 


Por lo tanto, 


Kg, =0 
De igual manera. si se posmultiplican ambos miembros de la ecuación (6-273) por & = G7 H, se obtiene 
K, = [0 0 1][H:GH:G*H]'G?G"*H 
=[0 0 1I[H:GH:G*H)"'H 
1 
=[0 0 1]/[H:GH:G”H]'(H:GH:G*H]|0|=0 
0 
De manera que, 
KE, = 0 
En consecuencia se tiene que 
Kié: & &jļ=[ 0 0] 
En consecuencia, 


K=[1 0 Olgi € ël” 


que es la ecuación (6-272). 
Para demostrar que É, es un vector característico de la matriz G — HK, observe que 


(G - HK), = (G - HK)G"*H = H - HKG`'H = H - HKE, 
En vista de que KẸ, = 1, se obtiene 


(G — HK)$, = 0 
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Para demostrar que & = GH es un vector característico generalizado de la matriz G — HK, observe que 
(G — HK)E, = (G — HK)G*H = G*H — HKG"*H = £, — HKE: 
Como Ké, = 0, se obtiene 
(G — HK)E, = E, 


Similarmente, para demostrar que £, = G” H es un vector característico generalizado de la matriz G — 
HK, observe que 


(G — HK)E, = (G - HK)G"*H = GH -— HKG*H = t, — HKg, 
Y en vista de que Ké, = 0, se obtiene 


(G — HK)E, = $ 


Problema A-6-14 


Considere el sistema definido por 


x(k + 1) = Gx(k) 
y(k) = Cx(k) 


donde x(k) es un vector de dimensión 3 y y(k) es un escalar. Se supone que el sistema es completamente 
observable. Se desea determinar la matriz de ganancia de realimentación del observador K, para un 
observador de predicción de orden completo, tal que la dinámica de error tenga raíces características en 
Z= HW, Z = 4 y Z = M3. Es decir 
zI — G + K. C| = (z — m)(z ~ m)(z — 1) 
=z + az? + œz +% 
Suponga que los valores característicos de G son A;, A, y Az y que son distintos de ¿,, 4, y 43. También 
suponga que 4), #2 y 3 son distintos. 
Demuestre que la matriz K, puede estar dada por 
ro 
K. =|f 1 

fz 

donde 


£ =C(G- maD”, i=1,2,3 


Demuestre también que las f; son vectores característicos de la matriz (G — K,C)*; esto es, f satisface 
la ecuación 


(G — K. C)*f* = ff, i = 1,2,3 


donde w; es el complejo conjugado de y. (Observe que cualquiera de los valores característicos comple- 
jos se presentan en pares conjugados.) 


Solución —Refiriéndonos a la fórmula de Ackermann, tal como se dio mediante la ecuación (6-126) para 
la matriz de ganancia de realimentación del observador K,, se tiene 


c |*o 
K. = $(G)| CG 0 
CG? 1 


Al observar que 


$(G) = G° + aG? + œG + œl = (G — MIG — mI)(G — mI) 
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se tiene 
c Po 
K. = (G — m D(G — u2D(G — paD| CG 0 (6-274) 
CG? 1 
Premultiplicando ambos miembros de esta última ecuación f, = C(G — a, 1)” resulta 
-1 
c 0 (6-275) 
f K. = C(G Ek 12D(G = 431) CG 0 
CG? 1 


Definamos 

(G ~ 1¡D(G - m1) = G + BG + BoI 

(G — mI)(G - mI) = G + BG + Bal 

(G — 13D(G — mI) = G + B2G + Bal 
Entonces la ecuación (6-275) se convierte en 

c po 

fiK. = C(G? + B2 G + Bz D| CG 0 
cG?| |1 


c c Ilo 
= [Bas Baz 1] CG CG 0 =1 
Por lo tanto, CG? || CG? 1 
fiK.= 1 


Similarmente se obtiene 


tK. = 1, fiK.=1 


Y así, 
f 
f: ¡K. =|1 
fs 
es decir, 
58/11 
K.=|f 1 (6-276) 
b 1 


La ecuación (6-276) da la matriz deseada K, en función de f,, f, y fz, donde 
(G — K.C)*f? = C* — C* + mfr = uf 
Para demostrar que las f/' son vectores característicos de la matriz (G — K, C)*, note que 
(G — K.C)*ff = (G — K.C)*[C(G — 4D ']* 
= (G* — CKI)(G* - m: D~ C* 
= (G* - 4,1 + mI- CK31(G* - I) C* 
= C* + (mI - C*K? f7 


= kak * fa Tm. 
= C* — CKE f* + pf: (6-277) 
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Como se ha demostrado antes, 


f/K. = 1 
En consecuencia, 
Kf = 
Por lo tanto la ecuación (6-277) se convierte en 
(G — K.CO)*f? = C* — C* + uf = mf? 
Así que se ha demostrado que los vectores fr, fz y f; son vectores característicos de la matriz (G — K, 
C)* correspondientes a los valores característicos 41, 4 y My, respectivamente. 


Problema A-6-15 


En el problema A-6-14 se obtuvo la matriz de ganancia de realimentación del observador K, para el caso 
en que los valores característicos 4, 4, y 4, de G — K, C fueran distintos. Supongamos que deseamos una 
respuesta con oscilaciones muertas para el vector de error. Entonces requerimos que 4, = 4, = 43 = Q. 
Demuestre que para este caso la matriz K, puede darse como sigue: 


Bio fı 1 
K.=|£| jo o K.=|f 0 
fı 1 fz 0 


donde 


fı = CG”, f: = CG”, fs = CG? 


ote que los vectores f,, f, y f dados aquí son los vectores característicos o vectores característicos 
q b b yh q 
generalizados de la matriz (G — K, C)*.] El sistema se supone completamente observable. 


Solución Refiriéndonos a la ecuación (6-274), 


c [o 
K. = (G — 41D(G — u2¿D(G — 13D] CG 0 
CG? 1 
Al tomar 4, = 4, = u; = 0 y sustituir de acuerdo con esta última ecuación, se obtiene 
c po 
e = @| CG 0 
CG? 1 
que se puede escribir como sigue: 
cG] o ft jo 
K. = | CG? 0|=|£ 0 (6-278) 
CG” 1 fı 1 : 
La ecuación (6-278) da la matriz de ganancia de realimentación del observador K, deseada cuando y; = x- 
= 43=0. 
Observe que la ecuación (6-278) puede ser modificada para leerse 
CG? 0 
CG”? |K. =|0 
CG 1 
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que es equivalente a las siguientes tres ecuaciones: 
CGK, =f.K.=0 
CG?K. =f.K.=0 
CGK. =fiK.=1 


Por lo tanto se obtiene que 


f K. f 1 
fK.|=|£ |K. =/0 
f,K. f 0 
es decir, 
El 
K. S fz 0 
fs 0 


que también da la matriz de ganancia de realimentación deseada, cuando y, = p, = 4, = Q. 
Problema A-6-16 
Considere el sistema 


x(k + 1) = Gx(k) + Hu(k) 


los) [7 


Suponga que se utiliza el siguiente esquema de control: 


u = -Kx 


donde 


Utilizando MATLAB, determine la matriz de ganancia de realimentación del estado K, de modo que el 
sistema tenga polos en lazo cerrado en 


z = 0.5 + j0.5, z=0.5-—j0.5 
Utilice la fórmula de Ackermann dada por la ecuación (6-68). 


Solución Primero construimos la matriz J, cuyos valores característicos son los polos en lazo cerrado 
deseados. 


g = [05 + j0.5 0 
0 0.5 — j0.5 


El comando poly(1) da el polinomio característico para J. 


1.0000 —1.0000 0.5000 





Esta es la expresión MATLAB correspondiente al polinomio característico para J. 


poly(J) = $(3) = J? — J + 0.51 
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donde 1 es la matriz de identidad. Para la matriz 


1.0 1 
EA 3] 


el comando polyvalm (poly (J), G) evalúa la H(G) siguiente: 


Ze _|-0o16 -1 |_[ o 1] fos o 
A AL Ea A e7 aeh 5 


_[0.34 -2 
0.32 2.34 


Vea la salida de MATLAB que sigue: 


polyvalm(poly()), G) 


ans = 


0.3400  -—2.0000 
0.3200 2.3400 





Refiriéndonos a la fórmula de Ackermann, dada por la ecuación (6-68), la matriz K deseada se obtiene a 
partir de 


K=[0 1][H GH]” p(G) 
= [0 11M” (G) 


donde M = (H GH). Un programa MATLAB para la determinación de la matriz de ganancia de 
realimentación de estado K se da en el programa 6-4 de MATLAB. 





MATLAB Programa 6-4 





% 





Colocación de polo en el plano z 





% ***Este programa determina el estado de la matriz de ganancia de 
% realimentación K, basado en la fórmula de Akermann ***** 


% Anote la matriz de estado G la de control H ***** 


G=[0 1;0,16 -1); 
H = [0;1); 


% ***** Anote la matriz de controlabilidad M y 
% compruebe su rango***** 


M=[H G*H); 
rank(M) 
ans = 

2 








% *****Como el rango de la matriz de controlabilidad es 2, 
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kkk 


% es posible colocar un polo arbitrario 


% **** Anote el polo característico deseado definiéndo 
% la siguiente matriz J y calcular poly())"**"* 


J = [0.5+0.5%i 0;0  0.5-0.5%] 
J] = poly()) 

Jj = | 
j 1.0000 -1.0000 0.5000 

Y ***** Anote el polinomio característico Phi***** 

Phi = polyvalm(poly()),G): 

% ">El estado de la matriz de ganancia de realimentación lo da"***** 
K=[(0  1|*inv(M)*Phi 

K= 


0.3400 -2.0000 











Problema A-6-17 
Considere el sistema 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
donde 
x(k) = vector de estado (de dimensión 3) 
u(k) = señal de control (escalar) 


v(k) = señal de salida (escalar) 


y 
0 1 0 0 
G=| 0 0 1 h H=fo| c=[0 1 0 
-0.5 -0.2 1.1 1 
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1. Determine la matriz de ganancia de realimentación del estado K, tal que el sistema muestre una 
respuesta con oscilaciones muertas a cualquier estado inicial. Suponiendo que el estado es completamen- 
te medible, de modo que el estado real x(k) puede realimentarse para control, es decir, 


u(k) = —Kx(k) 
determine la respuesta del sistema al estado inicial 
a 
x(0)=|b 
c 


siendo a, b y c constantes arbitrarias. 

2. Al suponer que sólo una porción del vector de estado es medible, es decir, solamente lo es la 
salida y(k), diseñe el observador de orden mínimo tal que la respuesta de error del observador sea con 
oscilaciones muertas. Suponga que la configuración del sistema es la misma que la que se muestra en la 
figura 6-11. 

3. Considerando que el estado observado se utiliza para realimentación, obtenga la respuesta del 
sistema a 

a 
x(0) =|b |, ê) = H 


c 


donde é(0) es el error de observador inicial para el observador de orden mínimo, y a, b, c, a y B son 
constantes arbitrarias. 
4. Deduzca la función de transferencia de pulso G,(z) del regulador-observador. 


Solución Observe que el sistema es de estado completamente controlable y observable, 
1. La matriz de ganancia de realimentación de estado K requerida para respuesta con oscilaciones 
muertas se puede obtener **-iImente como sigue. Definamos 
K= [ki k2 k3] 

Entonces 

z =] 0 

0 z -1 

k +05 k2+0.2 z+k -1.1 

z? + (k3 — 1.1)27 + (k2+0.2)2 + kı +0.5=0 
Al igualar esta ecuación característica a la ecuación característica deseada (para una respuesta con osci- 
laciones muertas), 


Izl — G + HK] 


obtenemos 
Con esta matriz K, la ecuación de sistema se convierte en 


x(k + 1) = Gx(k) + Hu(k) = (G — HK)x(k) 


es decir, 
x(k + 1) 0 1 0 x(k) 
x(k +1)|=|0 0 1]|| xk) 
x(k + 1) 0 0 0| x(k) 
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La respuesta de este sistema a un estado inicial arbitrario se convierte en: 


x() 0 1 Ojja b 
x(1)|=|0 0 1[|b|=|c 
x3(1) 0 0 0jjc 0 
x1(2) 0 1 0f[b c 
x(2)|=|0 0 1f[c|=]/0 
x3(2) 0.0 010 0 
x1(3) 0 1 Ole 0 
x2(3)|=|0 0 1[[0|=]/0 
xa(3) 0 0 010 0 


o sea 
x(k) = 0, k=3,4,5,... 
Claramente, la respuesta es con oscilaciones muertas. 

2. Ahora diseñaremos un observador de orden mínimo, suponiendo que solamente la salida y(k) 
es medible, Primero transformaremos el vector de estado x(k) a un nuevo vector de estado £(k), tal que la 
matriz de salida C se transforme de [0 1 0O]a[i 0 0]. La matriz siguiente T llevará a cabo la 
transformación requerida: 


0.1.0 
T=|1 0 0 
0.01 
Entonces definimos 
x(k) = TECk) 


De manera que las ecuaciones de sistema serán 


E(k + 1) = T*GTE(k) + T~ Hu(k) = GE(k) + Ĥu(k) 
y(k) = CTE(k) = CE(k) 


donde 


. o1ofo ı olo10 
G=T"GT=|1 0 0j o0 0o 1 [100 
o o 1j|-0.5 -0.2 11o 0 1 


C=CT=[(0 1 oj 
p 


El sistema transformado está dado por lo tanto por 
alk +1] j 02.01 jé] |o 
EKFD|=| 1.70 0 EE] + |O Ju(x) ea) 
Ek +1) -0.2 i -0.5 1.1 ]| &(k) 1 
i(k) (6-280) 
y(k)=[1:0 0] &(k) 
&lk) 
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En vista de que sólo se puede medir una variable de estado. (k). es necesario que se observen dos 
variables de estado. Por lo tanto. el orden del observador de orden mínimo es 2. Debido a que 


A A 0 0 ke 0 =ke, 
Go» - K. Gas = ue: A a [ke lo 1] = E I= al 


la ecuación característica del observador se convierte en 


ke, 


z =..52 e == 
E z114 k| TZ t KaT 12 — 0-Ska, 


Ízl == Gu + K. G.s| = 





La ecuación característica deseada (para respuesta con oscilaciones muertas) es 
z22=0 


Por lo tanto. 


es decir, 


A 


3. La ecuación para el sistema con realimentación de estado. con un observador de orden mínimo. 
corresponde a la (6-163): 


Esa] E [ea e gami 


Volvamos a escribir la ecuación (6-281) en función del nuevo vector de estado &k) y del vector de error 
ê(k). Al notar que el estado observado es el utilizado para la realimentación, esto es, 


u(k) = —KE(k) 
tenemos que 
E(k + 1) = GE(k) + Hu(k) 
= GE(k) — MKE(k) 
= (G — BK)E(k) + K[E(k) — E(k)] 
= (Ô — AR)JE(k) + HKTe(k) 


donde 

00 
r=|1 0 

0 1 

y 
01.0 

K=KT=[-0.5 -0.2 1.1] 1 0 0|=[-0.2 -0.5 1.1] 

0.01 


Por lo tanto, se puede modificar la ecuación (6-281) para quedar 
Ek + 1D] _ $- AE ARO] 
é(k + 19] 0 | Gs — K. Ga || é(k) 
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es decir, 
Ek +1) 001 0 0 J| &(&k) 
Elk +1) 100 0 0 || &lk) 
E(k+1)|=|0 0 0 -0.5 1.1]|| &(k) 
ê(k + 1) 000 0 0 J|ê(k) 
éXk + 1) 0 0 0 -0.5 0 ||éxk) 


La respuesta de este sistema a la condición inicial dada puede obtenerse como sigue. Primero observe 
que la condición inicial supuesta es 


x1(0) a 

x2(0) b 

x(0)|=|c 

é(0) a 

éx(0) B 

Por lo tanto, 

£,(0) b (1) c 
£0) a &(1) b 
&0)j=]c], &(1) | =] —0.5a + 1.18 
é,(0) a é(1) 0 
ê] |g ê(1) -0.Sa 
&(2) —0.5a + 1.18 &(3) —0.55a 
&(2) c &(3) —0.5a + 1.18 
(2) | = —0.55a í &(3)| = 0 
ê (2) 0 ê (3) 0 
ê(2) 0 ê(3) 0 
&(4) 0 &(5) 0 
&l4) —0.55a &(5) 0 
&Hal=| 0 |, E(5) | =| 0 
é(4) 0 €(5) 0 
ex4) 0 ê(5) 0 


Es claro que la respuesta es con oscilaciones muertas. Para cualquier condición inicial, el tiempo de 
asentamiento es como máximo de cinco períodos de muestreo. (Esto significa que como máximo se 
necesitan dos periodos para que el vector de error se convierta en cero y, además, como máximo son 
necesarios tres periodos de muestreo para que el vector de estado se anule.) 

4. Para deducir la función de transferencia de pulso Gp(z) del regulador-observador, nos referi- 
mos a la ecuación de estado y a la ecuación de salida que se da en las ecuaciones (6-279) y (6-280), 
respectivamente. Las ecuaciones para el observador de orden mínimo son las (6-148) y (6-149), escritas 
de la forma siguiente: 

Ex(k) — K.y(k) = n(k) 
Ck + 1) = (Gps — K.Goo)(k) + [Go — K. Ga» )K. 


+ Gra — K. Goa] y(k) + (Bo - K. A. Ju(k) (6282) 


Para este problema, 
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Gua ii K. Go = | 0 o 


-0.5:0 
Ĝe - KeĜa =| 1 
ba e aa —0.2 
fo -KeA = [9 


Por lo tanto, la ecuación (6-282) se convierte en 


ien os oios [ap + HO 


Si se toma la transformada z de esta última ecuación resulta 


zň(z) = E 0 fac + | Jalto + | ivo 


Los eho- [ako [ijo 


Al resolver en función de n(z), se obtiene 


es decir, 


L 0 
a= as 01 YO +|1 JU) 
LL z 
z z 
La ecuación (6-148) será entonces 
A 0 E 
EG) = 2,70 + a(z) 
F 0 
= os 02 P0+|1]U6) 
1:1:="=5=. z 
z z 


La señal de control u(k) está dada por 
u(k) = —KE(k) = -[-0.2 -0.5 1.1JẸ(k) 
= 0.2y(k) — [-0.5 1.1]ē,(k) 
La transformada z de esta última ecuación se convierte así en 


z 


U(z) = 0.2Y(2) - [-0.5 1.1] ce ae) 
Ta z 
0 
-[-0.5 1.1] 1 |U(z) 
zZ 


z 0.5 _ _95_ 0.2 11 
= [022 S rara ue Jro = U(2) 
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es decir, 





z? 


( + ue) = (-1o1 + 2z + essy) 


de lo cual se obtiene la función de transferencia pulso G,(z) del regulador-observador como sigue: 


U(z) _ 1.012? — 0.72z — 0.55 
PS A ic r (6-283) 
Go(2) Y(z) z? + 1.iz 
La función de transferencia pulso de la planta puede obtenerse mediante la ecuación (5-60) como 
sigue: 
_Y(z)_ EENE AA 
G,(z) = ae C(zI - G)`° H = C(zI - G)'H 
z 


T7- 11274022 +05 
En la figura 6-23 se muestra un diagrama de bloques del sistema regulador diseñado. 


2 
z?-1.1z?+0.2z+0.5 


Gplz) 


__1012?-0.722-0.55 
2+t1z 


-Golz) 












Figura 6-23 Diagrama de bloques del sistema regulador diseñado en el problema A-6-17. 
Problema A-6-18 


Considere el sistema de seguimiento definido por la ecuación (6-185). La ecuación característica para 


este sistema es 
Zinem — | G H ] =0 (6-284) 





K?- K.G-K,CG In- K¿H — K, CH 
Al volver a escribir la ecuación (6-284) se obtiene 
zI -G i -H | 


A AA ia 


—K, + K,G + K,CG |! Zim += Ls; + K.H + K,CH 
3 ah e 5 O ltz 














=(K, + K,C) In K,C TL, ~ Im || K: + K,C! In 
= || Z1 Z6 + (K: + KC) -H 
K, C i zim — in 
= || 71. 7 € + HK, + HK,C + HK; C(zIn — 15)? 1H 
0 ¡MEN ! Zim pa Im 
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A) PEA y ON 10 
K: C(zl,, — In) D 
z e EC EE G a e 
0 i Zim — In 
= jzIn — G + HK, + HK,C + HK,C(zL,, — Im) |zL» — In] = 0 (6-285) 


La ecuación (6-285) da la ecuación característica correspondiente al sistema. Se pueden determinar las 
matrices K, y K, de forma tal que las raíces de esta ecuación característica asuman los valores deseados. 
Por ejemplo, si se desea una respuesta con oscilaciones muertas a una entrada escalón, entonces determi- 
naremos K; y K, de modo que todas las raíces de la ecuación característica estén en el origen. [Cuando 
el vector de control u(k) es de dimensión m (siendo m > 1), las matrices K, y K, no son únicas. Es decir, 
se puede obtener más de un conjunto de K, y K)]. 

Refiriéndonos al problema de diseño del sistema de seguimiento analizado en el ejemplo 6-13, 
considere primero el problema de determinar una constante de ganancia integral K, y una matriz de ga- 
nancia de realimentación del estado K,, utilizando la ecuación característica dada por la ecuación (6- 
284), o la ecuación (6-285), tal que la respuesta escalón unitario sea con oscilaciones muertas. A conti- 
nuación considere diseñar un observador de predicción de orden completo (tercer orden), tal que la 
respuesta al error de observador sea con oscilaciones muertas. Si se define la matriz de ganancia de 
realimentación del observador como K,, determine esta matriz igualando los coeficientes de las poten- 
cias iguales de z de 


zI- G+K,C|=0 
y los de las potencias similares de z de la ecuación característica deseada, que es 
z? =0 
Solución Definamos 


K: = [ki kz ka] 


Al observar que 


0 1 0 0 
G=| 0 o  1| H=|o|, C=[05 1 0] 
-0.12 -0.01 1 1 


la ecuación (6-285) se puede escribir como sigue: 
lzd3 = G + HK, + HK,C + HK, C(zl = y" lzl, E Ll 
= |zL, - G + HK: + HK, C[1 + (z - 1) *]|[z — 1| 








z 00 0 1 0 0 
=||0 z O|-]| 0 0 1| +]0j[k; kz ka] 
00 z -0.12 —0.01 1 1 
0 1 
+|0]|[K,][0.5 1 ol + +) lz -1l 
1 z-1 
z -1 0 
Z 0 z -1 pia] 
A E s E A 
el z-1 
z -1 0 
= 0 z -1 


(0.12 + kz — 1) + 0.5K,z_ (0.01 + k2)(2 — 1) + Kız (2-1) + ks(z - 1) 
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=2% + (-2 + ks)z? + (1.01 + ko — k; + K,)2? 
+ (0.11 + kı de kı + 0.5K,)z — 0.12 — ki =0 


Esta ecuación caracteristica debe ser igual a 


Por lo tanto. requerimos que 
-2 +k;=0 
1.01 +k:-k;+ K =0 
0.11 + kı — k: + 0.5K, =0 
-0.12 - kı = 0 
de los cuales se obtiene 
K =3, kı = -0.12, kı =2%2, k;=2 
es decir. 
K, =3, K = [-0.12 0.3233 2] 


[Es evidente que estos valores concuerdan con los proporcionados por las ecuaciones (6-199) y (6-200).] 
A continuación, diseñaremos un observador de predicción de orden completo. Definamos 


Ko, 
K. ke, 
ke; 
Entonces 
0 1 0 kei 
G-K.C= 0 0 1/—|k., [0.5 1 0] 
-0.12 -—0.01 1 e3 
—0.SKk., E= ka 0 
= —0. Ske, =ke; 1 


, —0.12 — 0.5k., —0.01 — ke, 1 
y se tiene que 


z +0.5k., -1+K., 0 
lzl — G + K.C| = 0.Sk., z + Ko, -1 
0.12 + 0.Sk., 0.01 + ke, z-—1 
=z + (-1+0.5k., + k.,)2? + (0.01 — 0.Sk., — 0.5k., + k.,)z 
+ 0.12 — 0.115k,, — 0.5k., + 0.5k., = 0 
Esta ecuación característica debe ser igual a la ecuación característica deseada 
z =0 
Por lo tanto, 
-1+0.5k., + k.,=0 
0.01 E 0.Sk., haps 0.Sk., + ke; = 0 
0.12 — 0.115k., — 0.5k., + 0.5k., = 0 
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Al resolver estas tres ecuaciones simultáneas en función de ka, kea y ke, se obtiene 


ke, 0.5192 
K. = | ka, | = | 0.7404 
ke, | | 0.6198 


Esta expresión da la matriz de ganancia de realimentación deseada K.. 

Recuerde que el diseño de la constante de ganancia integral K, y la matriz de ganancia de 
realimentación del estado K, (un problema de ubicación de polos), y el diseño de la matriz análoga del 
observador K, (un problema de observador) son problemas independientes. Esto es, la matriz K, no 
depende de K, ni de K,, y viceversa. 


PROBLEMAS 
Problema B-6-1 


Considere el sistema definido por 
(k+D|_J]a b ||x(k) 1 
k + i g É A] i [ipo 
aE x(k) 


Determine las condiciones en a, b, c y d para la controlabilidad completa y observabilidad completa del 
estado. 


Problema B-6-2 


El sistema de control definido nor 


akty] [o ifaw] fai 
En + al y En di] 5 TO 
EN 2 | l 
x2(0) -1 


es de estado completamente controlable. Determine una secuencia de señales de control u(0) y u(1) tales 


que el estado x(2) sea 
x1(2) ra: iza 1 
x2(2) 2 


Problema B-6-3 


Considere el sistema 
x(k + 1) B 0 1 (k 1 
Es + p y | -0.16 a ` [ikw 
po fı 
x2(0) e -1 


Determine la posibilidad de llevar el estado a 


1. kol- E | 
A A O aE 
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x1(2) a -1 
A [5] -| J 
Problema B-6-4 


Considere el sistema 


0 1 0 
x(k +1) 0.0 1 x(k) 0 
x(k + 1)| = p x(k) | + | 1 ju(k) 
x(k +1) a b -5 x(k) 0 
Partiendo del estado inicial i 
x(0)=]|1 
1 
determine si el estado x(3) puede ser llevado o no al origen. También determine si puede ser llevado o no 
al valor 
1 
x(3)=]1 
1 


si el estado inicial es x(0) = 0. 
Problema B-6-5 


Para el sistema definido por 
x(k + 1) 5 0 1 x(k) 0 
Pr +91 | -016 -1l x0] + 10 
E xi(k) 
suponga que se observan las siguientes salidas: 
y(0)=1,  y(=2 
Las señales de control dadas son 
u(0) = 2, u(1) = -1 
Determine el estado inicial x(0). También determine los estados x(1) y x(2). 


Problema B-6-6 


Demuestre que el sistema 
x(k + 1) = G[x(k) + C*u(k)] 
y(k) = Cx(k) 
donde 
x(k) = vector de estado (de dimensión 4) 
u(k) = señal de control (escalar) 


v(k) = señal de salida (escalar) 


y 
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0100 

_[o0.1.0 "i 

G=lo ooa ¿140600 
1000 


es de estado completamente controlable y completamente observable. 
Demuestre también que, dado cualquier estado inicial x(0), todo vector de estado podrá ser lleva- 
do al origen en a lo máximo cuatro períodos de muestreo, si y sólo si la señal de control está dada por 


u(k) = —-Cx(k) 


Problema B-6-7 


Considere el sistema de control en tiempo continuo 


le delle 
y=bB až] 


Este sistema es de estado completamente controlable y completamente observable. Observe que los 
valores característicos de la matriz de estado son 
A = =3 + j4, à2 = -3 — j4 
Por lo tanto, este sistema involucra polos complejos. 
Como se indicó en la sección 6-3, un sistema que es de estado completamente controlable + 


completamente observable, en ausencia de muestreo se conserva en tales condiciones después del muestreo. 
si y sólo si, para todo valor característico de la matriz de estado (raíz de la ecuación característica), 


Rea; = Re Aj 


implica que 


Im (à; — A) 4 


donde T es el periodo de muestreo y n = +1, +2,.... 

Considere la versión discretizada de este sistema. Demuestre que para este sistema, si el periode 
de muestreo T = mn/4 (siendo n = 1, 2, 3, . . .), entonces el sistema discretizado es no controlable y no 
observable. 


Problema B-6-8 
Considere el sistema de transferencia pulso 


z(1+2z)) 
(1 + 0.52 (1 — 0.57?) 
Refiriéndonos a la sección 6-4, obtenga la representación en el espacio de estados del sistema de las 
siguientes formas: 


G(z) = 


1. Forma canónica controlable 
2. Forma canónica observable 
3. Forma canónica diagonal 
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Problema B-6-9 


Considere el sistema de función de transferencia pulso 


1 +0.87 * 
Gl) = ————_—_————= 
(2) 1-2*+0.52? 
Obtenga la representación en el espacio de estados del sistema en las formas siguientes: 


1. Forma canónica controlable 
2. Forma canónica observable 
3. Forma canónica diagonal 


Problema B-6-10 


Considere el sistema siguiente que se da en la forma canónica controlable: 


x(k + 1) o 1 0 lx] fo 


xík+1)|=) 0 0 1 | xxk)]+]/0ju(k) 
x(k + 1) +43 ~a ~a x(k) 1 
xi(k) 
y(k) = [b, — asbo: bz — azbo: bi — a1bo]| xk) | + bou(k) 
x(k) 


Se desea transformar las ecuaciones del sistema a dicha forma canónica observable, mediante la transfor- 
mación del vector de estado: 


x= 0% 
Determine una matriz de transformación Q de la forma canónica deseada. 
Problema B-6-11 


Considere el sistema de doble integrador 


x((k + 1)T) = Gx(kT) + Hu(kT) 


_(1 T ITR 
y Tes el período de muestreo. (Vea el problema A-5-16 para la deducción de esta ecuación de estado en 


tiempo discreto en relación con el sistema de doble integrador.) 
Se desea que los polos en lazo cerrado queden localizados en z = u, y z = m. Suponiendo que se 


utiliza el control de realimentación de estado 
u(kT) = —-Kx(kT) 


determine la matriz K de ganancia de realimentación del estado. 


donde 


Problema B-6-12 


Considere el sistema definido por 


x(k + 1) 0 1 0 x(k) 1 
xk+D|=| 0 0 1lxex)|+11 lux) 
xa(k +1)] |-0.16 0.84 oll r| |1 
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Determine la matriz de ganancia de realimentación del estado, K, tal que cuando la señal de control esté 
dada por 


u(k) = —Kx(k) 


el sistema en lazo cerrado mostrará una respuesta con oscilaciones muertas a cualquier estado inicial 
x(0). 


Problema B-6-13 
Considere el sistema 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
donde 
x(k) = vector de estado (de dimensión 2) 
u(k) = señal de control (escalar) 


y(k) = señal de salida (escalar) 


0 1 0 
DEP al u= [°], capu 


Diseñe un observador actual para el sistema. Se desea que la respuesta al error del observador inicial sea 
con oscilaciones muertas, 


Problema B-6-14 


y 


Considere el sistema 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
donde 
x(k) = vector de estado (de dimensión 3) 
u(k) = señal de control (escalar) 


y(k) = señal de salida (escalar) 


y 
0 0 -0.25 1 

G=|1 0 0 | H=|0| C=[1 00] 
01 05 1 


Si se supone que es medible la salida y(k), diseñe un observador de orden mínimo, tal que la respuesta al 
error de observador inicial sea con oscilaciones muertas. 


Problema B-6-15 


Considere el sistema definido por 


akt] [f o 1acwT, To 
l + AN 3 E? E ú HS 


Utilizando MATLAB, determine la matriz K de ganancia de realimentación de estado, tal que cuando la 
señal de control esté dada por 
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u(k) = —Kx(k) 


el sistema en lazo cerrado (sistema de regulación) muestra respuesta con oscilaciones muertas a un 
estado inicial x(0). Escriba un programa MATLAB para la determinación de la matriz de ganancia de 
realimentación del estado, K. 


Problema B-6-16 
Considere el sistema definido por 
x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 


0 -0.16 0 
e-f E | HH cC=[0 1] 


Mediante MATLAB. determine la matriz de ganancia de realimentación de observador, K,, tal que los 
valores característicos deseados para la matriz de observador sean 


p= 0.5 + jO.5, Ma = 0.5 — j0.5 


donde 


Suponga que la configuración del sistema sea idéntica a la mostrada en la figura 6-8. Escriba un progra- 
ma MATLAB utilizando la fórmula de Ackermann. 


Problema B-6-17 


La figura 6-24 muestra un sistema de seguimiento, donde el controlador inicial tiene un tiempo de retardo 
de un período de muestreo. (Compare este sistema con el sistema de seguimiento ilustrado en la figura 
6-18.) 














Controlador integral 











Figura 6-24 Sistema de seguimiento con realimentación del estado y control integral, que incluye un retardo unitario en 
la trayectoria directa. 


Determine la ganancia de trayectoria directa X, y la ganancia de retroalimentación X,. donde la 
respuesta a la entrada de secuencia escalón unitario (k) = 1 (donde k = 0, 1,2... .) sea con oscilaciones 
muertas. Graftque la respuesta v(x) en función de k. 


Problema B-6-18 


Considere el sistema de seguimiento que aparece en la figura 6-25. (Este sistema es similar al mostrado 
en la figura 6-24, excepto que el controlador integral tiene un elemento de retardo unitario en el lazo 
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Controlador integral 


Planta 


Figura 6-25 Sistema de seguimiento con realimentación del estado y control integral, que incluye un retraso unitario en 
el lazo menor. 


menor.) Determine la ganancia de trayectoria directa K, y la ganancia de retroalimentación K,, donde la 
respuesta a la entrada de secuencia escalón unitario r(k) = 1 (donde k=0, 1, 2, . . .), sea con oscilaciones 
muertas. Grafique la respuesta p(k) en función de k. 
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Enfoque de ecuaciones 
polinomíiales para el diseño 
de sistemas de control 


7-1 INTRODUCCIÓN 


En el capítulo 6 se diseñaron sistemas del estado de control mediante realimentación, o 
retroalimentación, al usar la técnica de ubicación de polos. Si algunas de las variables de estado no 
se podían medir de manera directa, se empleaban los estados observados para propósitos de 
realimentación. El diseño completo se realizó en el espacio de estados. 

Existe un enfoque diferente para el diseño de sistemas similares. Éste se denomina enfoque de 
ecuaciones polinomiales y es un enfoque alterno al diseño mediante ubicación de polos con un 
observador del estado de orden mínimo. (El enfoque de ecuaciones polinomiales se puede aplicar a 
sistemas con entradas y salidas múltiples. Sin embargo, en este capítulo, sólo se considera para sis- 
temas con una entrada y una salida.) 

Este capítulo presenta una explicación introductoria al enfoque de ecuaciones polinomiales 
para el diseño de sistemas de control. En este enfoque se resuelven las ecuaciones Diofantinas para 
determinar polinomios en z que se pueden utilizar para construir sistemas físicamente realizables. 
Este punto de vista proporciona una solución matemática rápida a ciertos tipos de problemas de 
diseño. 

La organización del capítulo es la siguiente: la sección 7-1 presenta algunos comentarios 
introductorios. La sección 7-2 explica las ecuaciones Diofantinas y provee los fundamentos mate- 
máticos necesarios para el enfoque de ecuaciones polinomiales para el diseño de sistemas de contról. 
La sección 7-3 presenta un ejemplo simple para demostrar el enfoque de ecuaciones polinomiales 
para el diseño de un sistema de regulación que tenga una ecuación característica deseada. La sección 
7-4 trata el enfoque de ecuaciones polinomiales al diseño de sistemas de control. La sección 7-5 
estudia el diseño de un sistema de control mediante la igualación a un modelo. Aquí se diseña dicho 
sistema de modo que su respuesta a cualquier entrada sea la misma que la especificada por un 
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modelo matemático. Para diseñar dicho sistema, se determinan, con base en el enfoque de ecuaciones 
polinomiales, filtros físicamente realizables que producen las características deseadas del sistema. 


7-2 LA ECUACIÓN DIOFANTINA 


En esta sección se explica la ecuación Diofantina. Considere el sistema definido por la función de 
transferencia pulso 





FA (7-1) 
aonde 

A(z) =z"+ az! +---+a iz +4, 

B(z) = boz” + biz! + --- + biz +b, 


Suponga que esta función de transferencia pulso es de estado completamente controlable y comple- 
tamente observable. Esto es, no existe una cancelación entre polos y ceros en la función de trasferencia 
pulso, o 4(z) y B(z) no tiene factores en común. Cuando los polinomios A(z) y B(z) no tiene cancela- 
ciones, se dice que son polinomios coprimos. Un polinomio en z se dice mónico si el coeficiente del 
término de mayor grado es uno. Por lo tanto, el polinomio A(z) es mónico. 

A continuación se define un polinomio estable D(z) de grado (2n — 1) como sigue: 


D(z) SEA dz”! + dyz”? +--+ dan —2 2 + da 
Entonces existen polinomios únicos de grado (n— 1), a(z) y B(z) tales que 
a(z)A(z) + B(z)B(2) = D(z) (7-2) 
donde 
a(z) = 0027 + az"? +- + 04-22 + ani 
B(z) = Boz"! E Biz"? q B,-22 + Br-1 
La ecuación (7-2) se denomina ecuación Diofantina, en honor a Diofanto de Alejandría (2469-3309 
d.C.). La ecuación Diofantina se puede resolver para a(z) y B(z) mediante el uso de la matriz de 


Sylvester E de 2n x 2n, la cual se define en términos de los coeficientes de los polinomios coprimos 
A(z) y B(z) como sigue: 


An 0O ... 0 bn 0 0 
An-1 An 20% 0 bn-1 bn 0 
D uhka e w a O y 0 
E = 1 aj e An bo b; ... bn (7-3) 
0 1 ani 0 bo bn- 
0 0 e A 0 0 ... b 
0 0 1 0 0 bo 


[Para utilizar la ecuación (7-3), el polinomio A(z) debe ser mónico. De otra forma, se deberá modi- 
ficar la ecuación (7-3).] Si n = 4, esta matriz se escribe como: 
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a a, 0 0 b, b, 0 0 
a 4 a, O b b, bi 0 
p=% R h 4 bi b, b, b; 
1 4d 4 4 bo b, b, b; 
0 1 a a, 0 bo bi b 
0 0 1 a 0 0 b b 
0 0 Q 1 0 0 0 b 


L 


La matriz de Sylvester E es no singular si y sólo si A(z) y B(=) son coprimos, o no tienen 
factores en común. Este hecho se puede ver de lo siguiente: en referencia a la matriz E anterior de 8 
x 8, el determinante |E] es: 


a3 A4 0 0 b, b, 0 0 
ad d3 A4 0 b, bs b, 0 
ar d2 03 d4 b, bı b, b, 








¡El z 1 dí 4&2 q bo b; b> b3 
0 1 a a 0 b bi b 
0 0 1 dr 0 0 bo bı 
0 0 0 i 0 0 0 b 
= D(A — As)(AÀ1 — AoA — AAi — As) 
e (A2 = As)(A2 = A6)(A2 — Ar) (A, — Às) 
+ (As — As)(À3 — As)lAs — Ar) (As — Ag) 
"(Ay — Asi(As — As)(As — A7)(% — As) (7-4) 
donde a, . . . , a4 Yy bi, . . . , b4 son los coeficientes de A(z) y B(z), respectivamente, y Aj, ..., Ay y 
As... , Az son las raices características de A(z) y B(2), respectivamente: 


A(z) =z + az? + az? + az + a = (2 — A(Z — Az — AZ — As) 

B(2) T boz’ + b, z? + b,z? + biz + b4 = balz e AG = AY = ANG = Ag) 
De la ecuación (7-4) se observa que el determinante |E| no es cero si y sólo si todos los factores 
multiplicativos en el segundo miembro de la ecuación no son cero, esto es, si y sólo si no hay 


cancelaciones entre 4(z) y B(z). [Para obtener la ecuación (7-4), refiérase al problema A-7-1.] 
Ahora se definen los vectores D y M tales que 


An-1 
den PE 
dan-2 ` 

D=| : | M= 8. 
d, Ba 
do mar 

Bo 
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Entonces los coeficientes œo, %,,..., %,1 Y Bo, Bi, . . -> Bn- Se pueden determinar a partir de 
M=E7D (7-5) 

La ecuación (7-5) da la solución a la ecuación Diofantina. [Para obtener la ecuación (7-5), véase el 

problema A-7-2.] 

Ejemplo 7-1 


Considere los siguientes 4(z) (un polinomio mónico de grado 2), B(z) (un polinomio de grado 1), y D(z) 
(un polinomio de grado 3): 


A(z)=22+2+0.5 

B(z)=z +2 

D(z) = 2? 
[Es claro que no hay factores comunes en A(z) y B(z).] El problema es encontrar dos polinomios únicos 
a(z) y B(z) tales que: 


a(2)A(2) + B(z)B(2) = D(z) 


donde 
a(z) = az +0 
B(2) = Boz + Bi 
o bien 
(aoz + az? + z + 0.5) + (Boz + BNG + 2) = 2? (0-6) 


La ecuación (7-6) es una ecuación Diofantina. Para resolver esta ecuación para a(z) y B(z), primero se 
debe observar que 


a=1, a,=0.5 
bo = 0, b =1, b=2 


y entonces la matriz de Sylvester E se escribe como: 


05 0 2.0 
li 0512 
E=); 1i 01 
o 100 


La inversa de esta matriz se puede obtener de una forma fácil con MATLAB. La salida de MATLAB para 
la inversa de la matriz E es: 


0.5000 O 2.0000 0 
1.0000 0.5000 1.0000 2.0000 
1.0000 1.0000 0 1.0000 

0 1.0000 0 0 


inv(E) 
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ans = 


0.4000 —0.8000 1.6000  —1.2000 


0 0 0 1.0000 
0.4000 0.2000 -—0.4000 0.3000 
0.4000 0.8000  -—0.6000 0.2000 





Ya que 
D(z) = 2* 


se tiene 


do = 1, dı =0, d: = 0, d=0 


Por lo tanto, la matriz D es 


ds 0 
_|d 0 
DS talSlo 
do 1 
Al definir la matriz M como 
Q 
Qo 
M= 
Bı 
Bo 
se obtiene la solución de la ecuación Diofantina de 
M=E 'D 


como sigue: 





o bien 
a(z) = aoz +a =z -1.2 


B() = Boz + Bı = 0.2z + 0.3 


Los polinomios a(z) y B(z) determinados de esta forma satisfacen la ecuación Diofantina dada por la 
ecuación (7-6). Para verificar esto, se debe notar que 
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(z — 1.2)? + z + 0.5) + (0.22 + 0.3)(z + 2) 
=z — 1.22? + z? — 1.22 + 0.5z — 0.6 + 0.22? + 0.3z 
+ 0.42 + 0.6 


= 2? 


7-3 EJEMPLO ILUSTRATIVO 


En el capítulo 6 se discutió el enfoque de ubicación de polos para el diseño de sistemas de control. Se 
estableció que algunas de las variables de estado podían no estar disponibles para medirse de forma 
directa, y que en tales casos el enfoque de ubicación de polos requería los estados estimados u 
observados para la realimentación. 

Veamos el ejemplo 6-11, donde se discutió el sistema de regulación con realimentación del 
estado. En tal sistema la ecuación característica estaba dada, y una de las variables de estado fue 
estimada mediante el uso de un observador de orden mínimo del tipo de oscilaciones muertas. En 
esta sección se mostrará que ese mismo sistema de regulación se puede diseñar mediante el enfoque 
de ecuaciones polinomiales. 


Sistema de regulación diseñado en el ejemplo 6-11. El sistema de regulación diseñado en el 
ejemplo 6-11 se presenta en la figura 7-1. La planta es de estado completamente controlable y com- 
pletamente observable. (No existe cancelación entre el polinomio numerador y el polinomio deno- 
minador.) El período de muestreo fue de 0.2 segundos, o T = 0.2. El controlador fue diseñado con 
base en el enfoque de ubicación de polos al especificar los polos de lazo cerrado en 


zı = 0.6 + j0.4, z: = 0.6 — j0.4 


y al incorporar un observador de orden mínimo para estimar las variables de estado para la 
realimentación. El observador de orden mínimo tenía la ecuación del error de observación 


d(2)=2 


El regulador diseñado fue 


Goíz) =2 a? - a 


z + 0.32 (1-7) 







0.02 (z + 1) 
iz - 1? 


Figura 7-1 Sistema de regulación diseñado en el ejemplo 
6-11. 
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A continuación se presentará el enfoque de ecuaciones polinomiales al diseño del mismo regu- 
lador dado por la ecuación (7-7) mediante la solución de la ecuación Diofantina. 


Enfoque de ecuaciones polinomiales para el diseño del sistema de regulación. Considere 
el diagrama de bloques de la figura 7-2. La función de transferencia realimentada B(2/a(z) funciona 
como un regulador. Se determinarán a(z) y (z) mediante el enfoque de ecuaciones polinomiales. 
Primero se debe notar que la función de transferencia de la planta es 


Y(z) _ B(2) _ 0.02(z + 1) 
U(z) A(z) (2-1) 





[4(z) es mónico de grado 2 y no hay cancelación entre A(z) y B(z).] Entonces, aunque R(z) = 0, la 
función de transferencia pulso en lazo cerrado para el sistema está dada por 


Y(z)_ a(z)B(2z) E 0.02(z + Da(z) 
R(z) a(zJA(z) + B(z)B(z2) a(zX(z — 1)? + B(2)0.02(z + 1) 


Como se estableció antes, en el ejemplo 6-1, se requiere que los polos de lazo cerrado deseados 
mediante realimentación de estado sean 


zı =0.6 + j0.4,  z,=0.6- 0.4 





o que la ecuación característica deseada sea 


H(z) = (z — 0.6 — j0.4)(2 — 0.6 + j0.4) 


= 22 — 1.2z + 0.52 
El polinomio del error del observador de orden mínimo fue 
F(z)=z 


Para determinar a(z) y B(z), se resuelve la ecuación Diofantina siguiente: 


a(z)A(2) + BRIB(2) = F()H(2) = D(z) (7-8) 
donde 
D(z) = F(z)H(z) = doz? + d,2? + dz + dy = 2? — 1.22? + 0.52z 


Observe que D(z) es un polinomio estable de grado (27 — 1) en z (donde n = 2 para este caso). Ya que 





Biz) _ 0.02 (z +1) 
A(z) (z - 1)? 





Figura 7-2 Diagrama de bloques del sistema de regulación. 
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A(z) = 2-22 +1 
B(z) = 0.02z + 0.02 


se tiene que 


a = —2, a=1, bo = 9, b, = 0.02, b = 0.02 
Al sustituir los polinomios 4(z}), B(z) y D(z) en la ecuación (7-8), se obtiene 


aæ(z)(z? — 2z + 1) + B(z)(0.02z + 0.02) = z? — 1.22? + 0.522 


Para resolver la ecuación Diofantina para &(z) y B(z), primero se define la matriz de Sylvester E de 
2n x 2n como: 


1 0 002 0 
-2 1 0.02 0.02 

1-2 0 0.02 

0 1 0 0 


La matriz inversa de E se puede obtener fácilmente con MATLAB como sigue: 
0.25 -0.25 0.25 0.75 
0 0 0 1 


37.5 12.5 -12.5 -37.5 
-12.5 12.5 37.5 62.5 


a(z) y B(z) son polinomios de grado n- 1 =2-— 1 = 1, o bien 


E= 


E` = 


a(z) = az + a 


B(2) = Boz + Bi, 
Se definen 
d; 0 Q 
_|d,| _ {| 0.52 _ |a 
aa e MS 
do 1 Bo 
Entonces el vector M se determina a partir de 
0.25 -—0.25 0.25 0.75 0 0.32 
o E 0 0 0 1 0.52| _ 1 
MEDEL 35 ms bs =nsl=iol” | =16 
-125 12.5 37.5 62.5 1 24 
Por lo tanto, 


a = 0.32, ay =1, Bı = -16, Bo = 24 
Entonces, a(z) y Plz) se determinan como 


a(z)= œz + a = z + 0.32 
B(2) = Boz + Bı = 24z — 16 
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y el regulador realimentado se obtiene como 


B(z) _ z — 0.6667 
PO -a AN 


que es idéntico al que se diseñó en el espacio de estado mediante el método de ubicación de polos 
combinado con un observador de orden mínimo. 


7-4 ENFOQUE DE ECUACIONES POLINOMIALES PARA EL DISEÑO 
DE SISTEMAS DE CONTROL 


En la sección 7-3 se diseñó un sistema de regulación al usar el enfoque de ecuaciones polinomiales. 
El diagrama de bloques del sistema de regulación diseñado se presenta en la figura 7-3. Recuerde 
que a(z) y B(z) se determinaron a partir de la ecuación Diofantina siguiente: 


a(z)A(2) + B(z)B(z) = H(2)F(z) 


donde A(z) es un polinomio mónico de grado n, B(z) es un polinomio de grado m (m < n) [se supuso 
que no hay factores comunes entre A(z) y B(z)], H(z) es el polinomio característico deseado para la 
parte de ubicación de polos, y F(z) es el polinomio característico para el observador de orden míni- 
mo. [Ambos polinomios H(z) y F(z) son polinomios estables.] El grado del polinomio H(z) es n y el 
del F(z) es n— 1. (Se supone que la salida del sistema es el único estado medible. Por lo tanto, el or- 
den del observador mínimo es n — 1.) 

A continuación se explicará el diseño de sistemas de control basado en el enfoque de ecuaciones 
polinomiales. Se consideran dos configuraciones diferentes de sistemas de control. 


Configuración 1 del sistema de control. El sistema de regulación presentado en la figura 
7-3 se puede modificar para un sistema de control cuya salida siga a la entrada de referencia. Un 
diagrama de bloques posible para este sistema de control se muestra en la figura 7-4. Como todo 
sistema de control, requiere tener una ganancia ajustable K,. Esta ganancia K, debe ser ajustada para 
que la salida en estado estable y(k) sea igual a uno cuando la entrada r(k) es un secuencia de escalón 
unitario. 


Figura 7-3 Diagrama de bloques del sistema de 
regulación. 
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Figura 7-4 Diagrama de bloques del sistema de 
control. 





La función de transferencia pulso en lazo cerrado Y(z)/R(z) es 
B(z) 
Yz) g 448 
RG) 5, , BOBO 
A(z)a(z) 
og Be 
"a(z)A(z) + B(z)B(z) 
x a(z)B(z) (7-9) 
° H(z)F(z) 
Observe que el sistema en lazo cerrado es de orden (2n — 1), a menos que ocurra alguna cancelación 
entre a(z)B(z) y H(2)F(2). Observe que la dinámica del numerador ha cambiado de B(z) a Kyo(z)B(2). 
Para determinar K, se hace que 
lim y(k) = lim (1 — 275 Y(2) 
co 2>1 
z-1 K a(z)B(z) z 
mz "H(z)F(z)z-1 
_ g a(1)B0) 
“HEFG) 
=1 














de donde se obtiene 
HOF) 
° aBC) 
Ejemplo 7-2 
En el sistema de regulación considerado en la sección 7-3, 
A(z) = (z - 1) 
B(z) = 0.02(z + 1) 
H(z) = z? — 1.2z + 0.52 


F(z)=z 
a(z) = z + 0.32 
B(2) = 24z — 16 
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Por lo tanto, la función de transferencia pulso en lazo cerrado Y(z)/R(z) se obtiene de la ecuación (7-9) 
como 

Y(z) _ Ko(z + 0.32)(0.02)(z + 1) 

R(z) z- 1.2z° + 0.52z 


Observe que en este caso K, está dada por: 
H(ODFO) _ 0.32 x 1 


ADE 132x004 7 6006 


Ko = 


Note que el sistema es de tercer orden. La respuesta al escalón unitario y a la rampa unitaria del sistema 
con K, = 6.0606 fueron presentadas en la figura 6-16 y 6-17, respectivamente. 


Configuración 2 del sistema de control. Un sistema de control con un diagrama de bloques 
diferente se puede diseñar mediante el uso del enfoque de ecuaciones polinomiales. Considere el 
diagrama de bloques de la figura 7.5. (Para obtener dicho diagrama de bloques, véase el problema 
A-7-3.) 

De la figura 7-5, se obtiene la siguiente ecuación: 
BG) 


ve) = EDU) - vo + E 


o Y(2)| + KRG) 


que se puede simplificar a 
a(z) _BG) 
+ 7-10 
EO) U(z) = FG FE z) + KoR(z) ( ) 
La función de transferencia pulso de la planta es 
Y(z) _ BG) 
U(z) A(z) 


donde 4(z) es un polinomio mónico de grado n y B(=) es un polinomio estable de grado m (m < n). Ya 
que 


A(z) 


BO (1-11) 


U(z) = 


Uiz) 





Figura 7-5 Diagrama de bloques del sistema de control. 
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al sustituir la ecuación (7-11) en la ecuación (7-10), se obtiene 


[nac ea 


FOBO ROO = KRG 


Entonces 
Ye o __ K 
Rz) aG)AG) , BW) 
F(z)B(z) F(z) 
2 KoF(2)B(2) 
a(zJA(z) + B(z)B(2) 
Ya que 
a(z)A(z) + B(2)B(2) = H(2)F(2) 
se obtiene 


RG) HORA HG) Gela 


Note que el polinomio del observador F(z) ha sido cancelado [como F(z) es un polinomio estable, su 
cancelación es permitida], y el polinomio característico del sistema en lazo cerrado está dado por 
H(z). H(z) es el polinomio estable de grado n deseado pero que, en esencia, “se escoge en forma 
arbitraria”. Por lo tanto, el sistema de control diseñado es de orden n. (En el caso del sistema de 
control de la configuración 1, el orden del sistema es 2n — 1, a menos que ocurra cancelación en el 
sistema diseñado, lo que resulta en una reducción del orden del sistema.) También se observa que la 
dinámica del numerador de Y(z)/R(z) no ha cambiado en el presente enfoque. [El numerador es B(z) 
multiplicado por la constante K..] 

Ejemplo 7-3 


Se diseñará un sistema de contro! con base en el diagrama de bloques de la figura 7-5, La planta que se 
considera está dada por 


B(2) z 0.02(z + 1) 

A(z) (z-17 
(El período de muestreo T es de 0.2 segundos). Se utilizarán los mismos polos en lazo cerrado deseados 
empleados en el ejemplo 7-2, es decir, 

zı = 0.6 + j0.4, Z2 = 0.6 — j0.4 

y se utilizará el mismo polinomio deseado del observador de orden mínimo, o bien, 

$(2) =2 

El polinomio característico deseado H(z) se escribe así 
H(z) = (z — 0.6 — j0.4)(z — 0.6 + j0.4) 
=z? - 1.2z + 0.52 


y el polinomio característico deseado F(z) del observador como 


er boe* 
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y se resuelve la ecuación Diofantina siguiente: 


a(z)A(z) + B(z)B(2) = H(z)F(2) 


o bien 
a(z)(z — 1 + B(z)X(0.02)(z + 1) = 2? — 1.22? + 0.52z (7-13) 
La ecuación (7-13) fue resuelta en la sección 7-3 y se obtuvieron a(z} y B(z) 
a(z) = z + 0.32 
B(z) = 24z — 16 
Al utilizar estas o(z) y (z) y en referencia a la ecuación (7-12), la función de transferencia pulso en lazo 
cerrado Y(z)/R(z) se puede escribir como: 
Y(z) _ KoB(2) _ Ko(0.02z + 0.02) 
R(z) H(z)  2?-1.2z + 0.52 
Para determinar la constante Ko, se requiere que y(%) en la respuesta al escalón unitario sea igual 
a uno. 
lim y(k) = lim(1 — 273) Y(2) 
— 00 z>1 
z — 1K0(0.02z + 0.02) z 
2 z 22-122 +0.52z-1 





Por lo tanto, el valor de K, es 
Ko =8 
Entonces se obtiene la función de transferencia pulso en lazo cerrado 


Y(z) _ _0.16z + 0.16 
R(z) 2?-1.2z + 0.52 


Es claro que el sistema diseñado es de segundo orden. El diagrama de bloques del sistema diseñado se 
presenta en la figura 7-6a). La figura 7-6b) muestra el diagrama simplificado. 

Ahora se examinará la respuesta al escalón unitario y a la rampa unitaria del sistema diseñado. El 
programa para MATLAB 7-1 se utiliza para obtener la respuesta al escalón unitario. El resultado se 
presenta en la figura 7-7. El programa para MATLAB 7-2 da la respuesta a la rampa unitaria. El resultado 
se muestra en la figura 7-8. 

El error en estado estable e(%) al seguir a la entrada rampa unitaria se obtiene como: Ya que 


Y(z) _ 8(0.02z + 0.02) 
R(z) 2? 1.22 + 0.52 





se tiene que 
E(2) = R() -— Y) = E - ZO lre) 
_ (z — 1)X(z - 0.36) 
“Aro 
donde 
0.2z 
a 
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0.02 (z + 1) Yiz) 





(a) 






8(0.02z + 0.02) 
z? - 1.27 + 0.52 






(b) 


Figura 7-6 a) Diagrama de bloques del sistema de control diseñado mediante el enfoque de ecuaciones polinomiales; 
b) diagrama de bloques simplificado. 





MATLAB Programa 7-1 


ho 


num=[0 0.16 0.16); 
den=[1 -1.2 0.52); 
r = ones(1,41); 

v=[0 40 O 1.6); 
axis(v); 

k=0: 40; 

y = filter(num,den,r); 
plot(k,y, o”) 

grid 

title(* UnitStep Response”) 
xlabel("k”) 

ylabel( y(k)”) 














Por lo tanto, 


. . z—1(z —1)(z — 0.36) 0.2z 
l k) = lim — =—_——— — 
A O TY 
= 0.4 
El error en estado estable al seguir a la entrada rampa unitaria es 0.4. 
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Respuesta escalón unitario 





* 
A E E SE MA NO CE | y 7 
| 
E i 
A 4 
Albo EE KEA dia Eros Al 
i 
1.2 F - 
eo 
o 
o 
o : i 
1+ A aa aa A | 











en o z , 
0.6r me , a bës A A ¿rod 3 $ á 
. : 
0.4 tp: ; . : cu : . A el Z 
0.25: A % aa à x i de k 4 
0 d , E zii TEL i 
0 5 10 15 20 25 30 35 40 


k 
Figura 7-7 Respuesta al escalón unitario del sistema mostrado en la figura 7-6(6). 


Programa de MATLAB 7-2 


O E A E i! 





num=[0 0.16 0.16); 
den=[1 -1.2 0.52); 

k= 0:20; 

r = [0.2*k]; 

v=[0 20 0 4); 

axis(v); 

y = filter(num,den,r); 
plotík,y, o ”,k,y”-",k,0.2*k,?-*) 
grid 

title(* UnitRamp Response “) 
xlabel("k”) 

ylabelC y(k)”) 











531 


Al comparar las respuestas al escalón unitario de los sistemas de control de la configuración | y 2 
se observa que son idénticas. Al comparar las respuestas a la rampa unitaria de los dos sistemas. se nota 
que el sistema de control de la configuración 2 tiene un error 10% menor en estado estable al seguir la 
entrada rampa unitaria que el sistema de contro! de la configuración 1. 
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Respuesta a la rampa unitaria 
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Figura 7-8 Respuesta a la rampa unitaria del sistema mostrado en la figura 7-6(b). 


7-5 DISEÑO DE SISTEMAS DE CONTROL MEDIANTE LA IGUALACIÓN A UN MODELO 


En la técnica de diseño presentada en la sección 7-4 (del sistema de control de la configuración 2), el 
polinomio del observador F(z) se canceló entre el numerador y el denominador de la función de 
transferencia pulso en lazo cerrado. [Véase la ecuación (7-12).] La ecuación característica del siste- 
ma diseñado fue H(z) que es un polinomio estable de grado n. [H(z) fue un polinomio estable de 
grado n deseado, pero escogido en un sentido “arbitrario”.] 

Suponga que la función de transferencia pulso de la planta es 


Y(z) _ B(z) 

U(z) A(z) 
donde 4(z) es un polinomio mónico de grado 7 en z y B(z) es un polinomio de grado m en z (m < n). 
y se supone que no hay factores comunes entre A(z) y B(2). Si B(z) es un polinomio estable (significa 


que todos los ceros están dentro del círculo unitario en el plano z), es posible escoger H(z) tal que 
incluya al polinomio B(z), o bien 


H(z) = Bl2)Hi(2) 
Entonces, en referencia a ła ecuación (7-12), se tiene 


Y(z) _ KoB(z) _ KoB(z) Ko 


R(z) H(z)  B(2)Hí(z) ~ H(z) 
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Por lo tanto, se eliminaron los ceros del polinomio numerador lo que significa que si se desea se 
pueden eliminar los ceros de la planta. 

Suponga que se quieren tener ciertos ceros en el numerador y ciertos polos en el denominador. 
Esto es, se quiere que el sistema posea ciertos polos deseados y ciertos ceros deseados como los de 
un “sistema modelo”, o bien 


YG) By, (2) 
R(2) T G modelo E An (z) 


Bajo ciertas condiciones, es posible diseñar tal sistema mediante el uso del enfoque de ecuaciones 
polinomiales. Ya que se obliga a que la función de transferencia pulso del sistema de control sea 
exactamente igual a la de un modelo, a este tipo de sistema de control se le llama sistema de control 
mediante la igualación a un modelo. 

En el proceso de diseño discutido en la sección 7-4, H(z) se escogió como el polinomio carac- 
terístico deseado de grado n. [H(=) es un polinomio estable de grado n que no es único, pero sí un 
poco arbitrario con tal de que produzca una respuesta aceptable del sistema.] Se escoge un polinomio 
estable de grado n — m como H(z). [A,(z) debe ser un polinomio estable pero en un sentido arbitrario 
que produzca una respuesta aceptable del sistema resultante.] Ahora se define el producto de B(z) 
por H(z) como A(z), es decir, 





H(z) = B(2)H:(2) 


Sistema de control mediante la igualación a un modelo. Primero se hará referencia al 
diagrama de bloques de la figura 7-9. Se supone que la planta B(2)/4(z) es de estado completamente 
controlable y completamente observable; esto es, no existen factores comunes entre A(z) y B(=). Se 
determinan a(z) y B(z) al resolver la ecuación Diofantina siguiente: 


a(z)A(z) + B(2)B(2) = F(2)B(2)Hi(2) 


donde F(z) es un polinomio estable de grado (n — 1). [Observe que a(z) y B(z) son polinomios de 
grado (1 — 1).] Entonces, del diagrama de bloques de la figura 7-9 se tiene 


U(z) = 26 U(z) — U(2) + vto)! + V(z) 


F(z) F(z) 






Gmogei Malz) 


Figura 7-9 Diagrama de bloques del sistema de control mediante la igualación a un modelo. 
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o bien 
n U(z) + T Y(z) = VG) 
Ya que 
—_ 4(z) 
U(z) = BC) Y(z) 
se tiene 
a(z) A(z) B(z) z 
FEBE O tpe OTD 
es decir 
Y(z) _ F(z)B(z) _ FGIBG)_ __1 
V(z) aœæ(z)A(z)+ B(z)B(z) F)BG)AH() Hi) 
También, 
VE) = G modeo MERE) 
Por lo tanto, 
1D) _ G modeto Hi (2) =G 


RG) VG)RG) H (2) 
En conclusión, se ha visto que si 
V (z) 
R(z) = G modelo 
entonces la función de transferencia pulso entre la salida Y(z) y la entrada R(z) es igual a G mogel: ASÍ. 
se logra el control mediante la igualación a un modelo. 





H(z) 


Comentarios. Al aplicar el presente enfoque para el diseño de un sistema de control median- 
te la igualación a un modelo, es importante recordar lo siguiente: 


1. Para hacer que la función de transferencia pulso G modlo A (z) sea físicamente realizable, el 
grado del polinomio numerador de Code H(z) debe ser igual o menor que el grado del 
polinomio denominador de Gmodejo H(z). De otra forma, el presente enfoque no se puede aplicar. 

2. Como se hizo notar antes, el polinomio numerador B(z) de la planta debe ser estable porque la 
cancelación de B(z) se realiza entre el numerador y el denominador de Y()/V(z). [Si B(z) no es 
un polinomio estable, esto es, B(z) tiene uno o varios ceros fuera del círculo unitario, entonces 
la cancelación de B(z) en Y(/V() producirá una respuesta inestable y el sistema diseñado será 
inestable.] 


Ejemplo 7-4 
Considere la planta definida por 


Y(z) _ 0.3679z + 0.2642 
U(z) (z — 0.3679(z — 1) 
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Suponga que el período de muestreo 7 es de | segundo. Se desea diseñar un sistema de control tal que el 
sistema en lazo cerrado sea: 


Yn(z) 0.627 — 0.3 


Rmkz) 221.22 + 0.52 





A esta función de transferencia pulso se le llamará función de transferencia pulso del modelo, o bien, 
Goao: y 


E) 0622-03 
Gmod = R (z) “27—122 +0.52 (7-14) 


Se supone que se utiliza la configuración del sistema dada en la figura 7-9. Observe que para la planta dada 
A(z) = z? — 1.3679z + 0.3679 


B(z) = 0.3679z + 0.2642 





Por lo tanto, 
aı = —1.3679, a, = 0.3679 


bo = 0, bı = 0.3679, 2 = 0.2642 


Claramente, el numerador B(z) es un polinomio estable. 

Como la función de transferencia pulso de la planta es de segundo orden (o n = 2), se escoge a 
H(z) como un polinomio estable de primer grado [de grado (1— 1)]. Por ejemplo, se puede escoger 
a H(z) como: 


H(z)=z +0.5 
[La selección de H,(z) es, en cierto sentido arbitraria, siempre que sea un polinomio estable.] Ahora se define 
H(z) = B(z)H,(z) = (0.3679z + 0.2642)(z + 0.5) 
Se escoge a 
F(z)=z 
[F(z) puede ser cualquier polinomio estable de grado (n — 1).] Entonces 
D(z) = F(z)H(z) = F(z)B(z2)H,(z)} = 2(0.36792 + 0.2642)(z + 0.5) 
= 0.36792? + 0.44822? + 0.1321z 


Por lo tanto, 
də = 0.3679, d, = 0.4482, də = 0.1321, d, =0 


Ahora se necesita resolver la ecuación Diofantina siguiente: 


a(z)A(z) + B(z)B(z) = F(2)B(2)H1(2) 
o bien 


a(z)(z? — 1.3679z + 0.3679) + B(z)(0.3679z + 0.2642) 
= 0.36792? + 0.44822? + 0.13212 


donde a(z) y B(z) son polinomios en z de primer grado. Entonces la matriz de Sylvester E de 4 x 4 para 
este problema es: 


a 0 b 0 0.3679 0 0.2642 0 

p= o 2 bı baj _| —1.3679 0.3679 0.3679 0.2642 
1 a bo bi 1 -1.3679 0 0.3679 
0 1 0 bo 0 1 0 0 
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Entonces, al utilizar MATLAB, E`! se puede obtener como se muestra a continuación. 


0 0.2642 
0.3679 0.3679 
1.3679 0 
1.0000 0 


—0.3849 0.2764 
0 0 
0.5359 —0.3849 
1.0461 1.9669 





Se definen 
d; 0 Qı 
= d> = 0.1321 _|% 
DS lalo M=|g 
do 0.3679 Bo 
Entonces la matriz M se obtiene como sigue: 
0.2642 
-paip | 0.3679 
MR DSa 
1.8680 


Por lo tanto, 
a(z) = az + e, = 0.36792 + 0.2642 
B(z) = Boz + Bı = 1.8680z — 0.3679 
Al usar estos polinomios a(z) y Blz), Y(z)/V(z) se escribe como: 


TOVO E 100 SEA TEE: 
VG) F()B(2)H(2) H(z) z +0.5 
Ya que V(z)/R(2) es 
V(z) DE (0.622 —0.31(z + 0.5) 
R(z) z? -122+0.52 





Ja función de transferencia pulso Y(z)/R(z) es 


Y(z) _ 0627-03 _ E 
RGE) z? -1224+052 m 





El sistema de control mediante la igualación a un modelo diseñado tiene el diagrama de bloques que se 
presenta en la figura 7-10a). Este diagrama de bloques se puede simplificar a los mostrados en las figuras 
7-10b) y c). 
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(0.627 - 0.3)(z + 0.5) 
z?-1.22+0.52 





0.36797 + 0.2642 
(z - 0.3679)(z - 1) 





0.36792 + 0.2642 1.86802 - 0.3679 


2 









0.62z - 0.3 
z? - 1.2z + 0.52 


(b) 


0.62z- 0.3 


z? - 1.2z + 0.52 





(c) 


Figura 7-10 a) Diagrama de bloques del sistema de control mediante la igualación a un modelo; b) y c) diagramas de 
bloques simplificados. 


La respuesta al escalón unitario y a la rampa unitaria del sistema modelo se muestra en las figuras 
7-11 y 7-12, respectivamente. La respuesta al escalón unitario presenta aproximadamente un 30% de 
sobrepaso, y el error al seguir la entrada rampa unitaria es de alrededor de 0.55, 


Comentarios. Es importante observar que este enfoque es diferente al de multiplicar el filtro 
siguiente (función de transferencia pulso) 


(z — 0.3679 (z — 1) 0.622 — 0.3 
z? = 1.22 +0.52 0.3679z + 0.2642 








por la planta. Aunque, de forma matemática, el producto sea 


(z — 0.3679)(z — 1) 0.622 — 0.3 0.3679 + 0.2642 _ _0.62z — 0.3 
z? — 1.2z +0.52 0.3679z + 0.2642 (z — 0.3679z — 1) 2? = 1.22 + 0.52 





y el sistema resultante tiene la función de transferencia pulso del modelo, en este caso, la cancela- 
ción se realiza entre un polo críticamente estable en z = 1 y un ceroen z= l, 
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Respuesta al escalón unitario 









1.6 - , 
VA diia dla EAA ean 
ye 
didas EAR A Ea A E r E A E S E N 
co 
di : : : i ; : i; 
Tross E EEEE EEEE E E E 
209 f A 
Á Sel A : AAN TE E o = E: a cta : oee 

(1R Poio S E : ; i 
04 EE ; Vaaa Dia : ; 
(ao A EEE E ET 

0 5 10 15 20 25 30 35 40 


Figura 7-11 Respuesta al escalón unitario del modelo Gwaen dado por la ecuación (7-14). 


Respuesta a la rampa unitaria 


y(k) 





Figura 7-12 Respuesta a la rampa unitaria del modelo G moai dado por la ecuación (7-14). 
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y el sistema se vuelve inestable. [Recuerde que nunca debe cancelar un polo inestable (o críticamente 
estable) con un cero.] En el presente enfoque de ecuaciones polinomiales, no ocurren cancelaciones 
entre polos inestables (o críticamente estables) y ceros durante el proceso de diseño y, por lo tanto, el 
sistema resultante siempre es estable. 

Si no se desea que exista error en estado estable al seguir la entrada rampa, entonces se requie- 
re cambiar el modelo. Por ejemplo, si se utiliza la función de transferencia pulso siguiente como la 
función de transferencia pulso del modelo revisado 


_ 082-048 
modelo * 221224052 Gmin) 


entonces el error en estado estable al seguir la entrada rampa se hace cero. Sin embargo, el sobrepaso 
máximo en la respuesta al escalón unitario es de alrededor de 45%. La respuesta al escalón unitario 
y la respuesta a la rampa unitaria se presentan en las figuras 7-13 y 7-14, respectivamente. 

Observe que al cambiar el modelo no se cambia el diagrama de bloques entre Y(=) y V(2), 
porque VMz)/V(=) es independiente de la función de transferencia pulso del modelo. Además, si se 
desea cambiar el modelo, sólo se necesita cambiar la función de transferencia pulso del primer 
bloque desde G a Grodelo* 


modelo 


Respuesta al escalón unitario 


y(k) 








0 5 10 15 20 25 30 35 40 
k 


z 


Figura 7-13 Respuesta al escalón unitario del modelo G/,..,,, dado por la ecuación (7-15). 
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Respuesta a la rampa unitaria 


y(k) 














2 
modelo 


Figura 7-14 Respuesta a la rampa unitaria del modelo G dado por la ecuación (7-15). 


PROBLEMAS DE EJEMPLO Y SOLUCIONES 
Problema A-7-1 


Considere los polinomios 
A(z2)=2+a,12 +40) 


Bíz) = boz? F biz + bz 


La matriz de Sylvester E se define como 


a2 0 bz 0 
_|4 M bi bz 
Ez 1 4 bo bi 
0 1 0 b 


Muestre que la matriz E es no singular si y sólo si no existe cancelación entre los polinomios 4(z) y B(=). 


Solución Se supone que las raíces de A(z) =0 son A, y A, y los de B(z) = 0 son À; y Ay. Por lo tanto, 


A(z)=z°+ az +0,= (2 - AM — A2) 
= z? == (A; + A2)2 + Ài Az 
Bíz) = boz? + biz + ba = boz — AsMz — As) 


= bz? — bol às + Aa)z + bDoAs As 
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De donde, 
as = (As + Az), qa = Az A2 
bı = —bo(As + As), b2 = bo Às As 


La matriz E se escribe en términos de A como 


A1 Az 0 bo Az As 0 
E e (Ar + A2) Ar A2 —bo(As + As) bo Az As 
1 (Ar + A2) bo —bo(à3 + As) 
0 1 0 bo 


El determinante de la matriz E se puede calcular al utilizar la expansión de Laplace en menores. 












































|El == Ar Az 0 bo 0% bo (A + Aa) da | Ar A2 0 —bo(As + Aa) boAzAs 
(Ar + A2) Ài Az 0 bo 1 (A + A2) 0 bo 

+ Ar Az 0 —bo(A + As) bo Az As + e + A2) Ar Az bo Az As 0 

0 1 bo —bo(As + Aa) 1 (A; + A2) 0 bo 
- | + A2) Ar Az boAzAs 0 4 l! —(Ar + A2) boAsAs 0 

0 1 bo —bo(Az + Aa) 0 1 —bolAz + As) boAzAa 











= At Az bo — (A Az + Ay AZ)DO(As + Aa) + A1A2DÍ(AS + 2A3 A4 + AZ) — Ar A2 b2 As As 
+ (AT + Ar Az + AZ)DG Az Aa — DólAr + AAAs + Ag)A3 Aa + b2 AZAZ 
= DATA — AŽA2A3 — A1 AŽ As — AŽA2A4 — Ar Aa 
+ A À2A3 + 212243 Aa + Ar A2 AG + Ag As Aa + Ar Àz Às Àa 
+ A2 Às Àa — Àr Aj Àa — AZAZ Àa — À Às AZ — A2 A3 AZ + AZAZ) 
Al reacomodar los términos del segundo miembro de esta última ecuación. se obtiene 
JE| = bAT AZ — A1 AZ As — Ar AZ A4 + AZ A3 Aa — Aj A2 hs 
+ AL À2AZ + Ai À2À3 A4 — Az Aj As — A? A2 Àa 
+ Àr Àz À3 Àa + A1 4243 — Àz A3 Ad + AF A3 As 
— MA Àa — MAS AG + ASAA) 
= DAL — ArAs — Arda + As Aa)(À? — A2 As — Àz ka + A3 Aa) 
= bo(Ar — A3)(À1 — A4)(Àz — As) (A? — A) 


El determinante |E] no es cero si al menos A, = À; 0 À; = À4 0 À, = À; 0 À, = Ay. Por lo tanto, E no es 
singular si y sólo si no ocurre cancelación entre 4(z) y B(z). Esto es, si A(z) y B(z) son polinomios 
coprimos, entonces |E] no es cero y E”! existe. 


Problema A-7-2 








Suponga que en los polinomios A(z) y B(z) no ocurre cancelación y que están dados por 
A(2)=22+a12 +a 
B(2) = boz? + bız + ba 


Entonces la matriz de Sylvester E está dada por 


a2 0 bz 0 
_|% ez bi b 
E= 1 äi bo b, 
0 1 0 b 
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Se definen 
a(z) = 002 +0 


B(z) = Boz + Br 
D(z) = doz? + diz? + dzz + da 


Muestre que si 
a(z)A(z) + B(z)B(z) = D(2) 


entonces A, %,, Bo, y B, se pueden determinar al calcular 


M=E"'D 
donde 
da a 
D= del: M= pS 
do Bo 


Solución Primero se debe notar que 


a(2JA(2) + B(2)B(2) = (az + (2? + az + a) + (Boz + BiNboz? + biz + b) 
= (æo + BoboJz? + (a + aa + Bı bo + Bobr)2? 
+ (94141 + avaz + Bib, + Bob)z + aa, + Bib, 
= D(z) = doz? + dız? + dzz + ds 
De donde, 
do = œo + Bobo 
dı = a41 + 041 + Bibo + Bob: 
dı = 4141 + aoa + Bib, + Bob, 


d3 = aa, + Bib, 
Ahora se calcula EM. Ya que 


2 0 bz 0 a 

i a bı bz Qo 
EM = 

1 a bo bı Bi 


0 1 0 boll B 


aia + Bib, 

q141 + Qol + Bib; + Bob» 

a + aa + Bı bo + Bib, 

Qto + Bobo 

al comparar cada elemento del segundo miembro de esta última ecuación con d3, dv, di, y do, respectiva- 
mente, se tiene 


dz 
-|%|_ 
EM =|¿ |=D 
do 
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De donde, 
M=E"'D 


o los coeficientes de los polinomios a(z) y B(=) se pueden determinar al multiplicar E~ por D. 


Problema A-7-3 


En el capítulo 6 se diseñaron sistemas de regulación y sistemas de control al utilizar un esquema de 
realimentación del estado observado. En sistemas de una entrada y una salida, la salida siempre es medible. 
Por lo tanto, en dichos sistemas se requieren observadores de orden mínimo, en lugar de observadores de 


orden completo. 
Considere el sistema de regulación diseñado mediante el enfoque de ubicación de polos combina- 
do con el observador de orden mínimo. Las ecuaciones de la planta son 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 


donde x es un vector de dimensión ». u(k) es un escalar. y v(k) es también un escalar. Se supone que la 
planta es de estado completamente controlable y completamente observable. Las ecuaciones de la planta 
se pueden rescribir como 


Xa(k + 1) Gas Gas || xa(k) H, 
= + 
er + p] a A g, (44) 
k) 
k)=[1 Xal 
x% =[ ol zo! 
donde y(k) = x,(k) es la variable de estado medible y x,(k) está formado por las variables de estado no 
medibles. 


La ecuación para el regulador observador (controlador) se pueden obtener de las ecuaciones 
(6-148), (6-149) y (6-159), reescritas 


Xo(k) — K.y(k) = n(k) (7-16) 
lk + 1) = (Goo — Ke Gas)m(k) 
+ [(Goo — Ke Gas)Ke + Goa — Ko Gaa] y (k) 
+ (H, — K.H,Ju(k) (7-17) 
u(k) = —Kx(k) (7-18) 


donde K es la matriz de ganancia de la realimentación del estado y K, cs la matriz de ganancia del 


observador. Se define 
a _ [xa] _ | y (A) 
Dis k8] 7 KA 


donde x(k) es un vector de dimensión n y X,(k) es un vector de dimensión (n — 1) que consiste de las 
(11— 1) variables de estado observadas. También se define 


K= [kı ks] 
Entonces la ecuación (7-18) es 
u(k) = [ko TEA = -kı y(k) — ks žo (k) (7-19) 
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Muestre que las ecuaciones del regulador (o controlador) pueden estar dadas por: 


UG) _ BG) 
Y(z) a(z) 


donde 
a(z) = k, W(z)Q + F(2) 
BC) = (kı + k,K.)F(2) + ks W(z)P 
P = (Gss — Ke Ga)Ke + Goa — Ke Gaa 
Q = H, - K. Ha 


F(2) = |21 — G,, + K, Gal = ecuación característica para el observador de orden mínimo 
(polinomio estable de grado n — 1) 


W(z) = (zI -= Gss + K. Gao) * F(z) 
También muestre que el diagrama de bloques para el sistema de regulación puede estar dado como el que 


se muestra en la figura 7-15. 


Solución Al tomar la transformada z de la ecuación (7-17), suponiendo condiciones iniciales cero, se 
obtiene 


zm(z) = (Gas — K.Gao)Jm(z) + [(Gp — K.Guo)K. 
+ Goa — K, Gaa] Y(2) + (H, - K. Ha)U(z) 
= (Gs — K. Gaz) + PY(z) + QU(2) 

que se puede escribir como 

(21 — Goo + K. Ga)ū(z) = PY(2) + QU(2) 
Resolviendo esta última ecuación para Y (z), se tiene 

A(z) = (21 — Goo + K, Ga) [PY (2) + QU(z)] (7-20) 7-20) 
Ya que 


wWG) _W() 


zi — Go + K. Ga AA AA 
( bb b) Ízl — Goo + Ke Gael] F(z) 








Figura 7-15 Diagrama de bloques del sistema de regulación. 


www.FreeLibros.me 


Capítulo 7 Problemas de ejemplo y soluciones 545 


la ecuación (7-20) se escribe como sigue: 


a0) = FS PYG) + QUE)] 021) 


Al sustituir la ecuación (7-16) en la ecuación (7-19), se obtiene 
u(k) = —k1y(k) — ko[K.y(k) + n(%)] 
La transformada z de esta última ecuación da 
U(z) = -k,Y(2) — ko[K.Y (2) + n()] (7-22) 
Al sustituir la ecuación (7-21) en la ecuación (7-22) da 
Wiz) 


F(z) 
Pue) -|k + kek, + k AOp ro 


F(z) 
k, W(2)Q + F(z) 
-| Ho 7 ivo 


J E + ks K. + e TOP lre) (7-23) 





U(z) ¿(PY (2) + QU(2)] 


-kı Y(z) — ko K.Y (2) — ko 








—k, 





F(z) 


Al utilizar a(=) y B(=) definidos en el enunciado del problema, la ecuación (7-23) se puede escribir como: 





ue) = FU) + ua) - ES YO) (7-24) 
de donde se obtiene 
a(z) p(z) 
T 
o bien 
UG) _ BG) 
Y) al) (1523) 


[Observe que #(z) es un polinomio estable. Por lo tanto, las dos F(z) se pueden cancelar.] La ecua- 
ción (7-25) es la ecuación del regulador (controlador). El diagrama de bloques que representa a la ecuación 
(7-24) se vuelve el de la figura 7-15. (Este corresponde a un sistema regulador.) Si este diagrama de 
bloques se incorpora al sistema de control, se obtiene el diagrama de bloques de la figura 7-5, 
Problema A-7-4 

En referencia al sistema de ejemplo discutido en la sección 7-3 (el sistema de regulación diseñado en el 
ejemplo 7-6) y al problema A-7-3. verifique que 

a(z) = k,W(2)Q + F(2) = z + 0.32 

B(2) = (kı + ks Ke)F(z) + k W(2)P = 24(z — 0.6667) 
Solución En referencia al ejemplo 6-11, se tiene 

x(k + 1) = Gx(k) + Hu(k) 


k) = Cx(k 
wd eel DE me 
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donde 
f1 02 _ [o.02 A 
gaj, E aen. c=[i 0] 


Gaa = 1, Gas = 0.2, Gia = 0, Go = 1, 
H, = 0.02, H, = 0.2 


De donde. 


Para la parte de ubicación de polos, la ecuación característica deseada fue 
lzl — G + HK! = z? - 1.2z + 0.52 = 0 

La ganancia de realimentación del estado K para la ecuación característica deseada se obtuvo como 

K = [8 3.2] 
Por lo tanto, 

ki =8, ks = 3.2 

Para la parte del observador de orden mínimo, la ecuación característica del observador fue 

ġ(z)=z=0 
La ganancia del observador K, se obtuvo como 

K.=5 


De donde, P, O, F(z), y W(z) se obtuvieron como sigue: 
P = (Goo = K.Gap)K. + Gba el K. Gaa 


=(1-5x02)x5+0-5x1=-5 
Q = H, - K.H, = 0.2 - 5 x 0.02 = 0.1 
F(z)=z 
W(2) = (z — Gaes + Ke Ga) F(z) = (2-1+5x0.2)'z =1 
En consecuencia, 
a(z) = ka W(z)Q + F(2) =32x1x01+z 
= z + 0.32 
B(z) = (ki + ks Ke)F(z) + ko W(z)P 
= (8 + 3.2 x 5)z + 3.2 x 1 x (-5) 


= 24z — 16 = 24(z — 0.6667) 
Problema A-7-5 


Muestre que el diagrama de bloques de la figura 7-5 se puede modificar al que se muestra en la figura 7-16. 


Solución El diagrama de bloques de la figura 7-5 se puede modificar al de la figura 7-17. Ya que la 
función de transferencia pulso del lazo menor es 





U(z) _ 1 _ F(z) 
X (z) e(z)_, &(2) 
1+ F(z) 1 


al eliminar el lazo menor se obtiene el diagrama de bloques de la figura 7-16. 
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Fiz} Biz) 
alz) Alz) 





Figura 7-17 Diagrama de bloques de la figura 7-5 modificado para tener un lazo menor. 


Problema A-7-6 


Considere una planta definida por 


CO: AA 
U(z) z?+z +0.16 


Utilizando el enfoque de ecuaciones polinomiales, diseñe un sistema de control para esta planta basado 
en el diagrama de bloques mostrado en la figura 7-5. Suponga que la ecuación caracteristica deseada es 


H(z) = (z — 0.6 — j0.4)(z — 0.6 + j0.4) 
=z? — 1.2z + 0.52 


y que F(z) (el polinomio del observador de orden mínimo) es 
F(z)=z 
Solución En referencia a la figura 7-5, (2) y B(2) se determinan de la ecuación Diofantina siguiente: 


a(zJA(z) + B(z)B(z) = H(z)F(z) = D(z) 
donde 
A(z) = 2? +z +0.16 


B(z)=1 
D(z) = z? — 1.2z? + 0.52z 
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La matriz de Sylvester E para este caso es 
0.16 0 


hb 
ha 

Ooom 

000 


La inversa de la matriz E se puede obtener como 


0 0 Ml 
0 0 0 1 


aer 
E =|} o =0.16 016 
0 1 -1 0.84 
Observe que a(z) y B(=) son polinomios de grado n— 1 =2-—1 = L, o bien, 
a(z) = 0z + Qi 
BG) = Boz + Bi 
Se definen 
d; 0 a 
_ dz E 0.52 _|% 
E dı -1.2 d M g Bı 
do 1 Bo 
Entonces el vector M se determina a partir de M = E” D como sigue: 
-2.2 
ye 1 
=FIn= 
ii 0,352 
2.56 


De donde a(z) y B(=) se determinan como 

a(z)=z - 2.2 

Biz) = 2.56z + 0.352 
En referencia a la ecuación (7-12), el sistema diseñado tiene la función de transferencia pulso V(z)/R(=: 
siguiente: 


Y(z) KoB(lz) K 1 
R(2) HG) “z —1.2z + 0.52 





A continuación se necesita determinar la ganancia K, de la figura 7-5. Se requiere que la salida er. 
estado estable y(*<) a una entrada escalón unitario sea uno, o 


à z z—i1 Ko £ 
limyt) = lim z z-1.2z+0.52z-1 





1 


de donde se obtiene 
Ko = 0.32 
Por lo tanto, la función de transferencia pulso del sistema diseñado es: 
Y(z) _ 0.32 
R(z) 2?- 1.2z + 0.52 


Un diagrama de bloques para el sistema diseñado se presenta en la figura 7-18. La respuesta al escalóz 
unitario del sistema diseñado se muestra en la figura 7-19. 
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1 
22 4+2+0.16 


2.562 + 0.352 
Z 


Figura 7-18 Diagrama de bloques del sistema diseñado en el problema A-7-6. 


Respuesta al escalón unitario 


1.6 


YA paris : E ES A da IN ias O Ma 4 


gun E A EE EEEE EEEE 





g 0 orar a T E E E Oy 
0.6 eiri e dna aT o ea pia rr a aia 
0.4 NN O OOOO 
Oo A OE T E r 
0 
0 5 10 15 20 25 30 35 40 
k 


Figura 7-19 Respuesta al escalón unitario del sistema diseñado en el problema A-7-6. 


Problema A-7-7 
En el problema A-6-17 se consideró el diseño de un sistema regulador donde la planta estaba definida por 
x(k + 1) = Gx(k) + Hu(k) (7-26) 
y(k) = Cx(k) (7-27) 
donde 
0 1 0 


0 
G=| 0 0 1 | H=]jo|, C=[0 1 0] 
-0.5 -02 11 1 
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Se utilizó el enfoque de ubicación de polos para determinar la matriz de ganancia K de realimentación 
del estado tal que el sistema de regulación presente una respuesta del tipo de oscilaciones muertas para 
cualquier estado inicial. Se usó un observador de orden mínimo tal que la respuesta al error de observa- 
ción fuera del tipo de oscilaciones muertas. 

Con el enfoque de ecuaciones polinomiales, diseñe un sistema de control equivalente para esta 
planta cuya configuración del diagrama de bloques sea la misma que la que se presenta en la figura 7-4. 
Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema diseñado. El período de muestreo 
T del sistema es de 0.2 segundos. 


Solución En referencia al problema A-6-17. la ecuación característica deseada fue 
l721-G+HK|=2=0 
Se define a 
H(z) = z’ 
La ecuación caracteristica del error de observación fue 
[zI — Goo + K. Go! =2=0 
Por lo tanto. se define a 
F(z) = 2? 
A continuación se define la función de transferencia pulso G,(=) de la planta 
G,(z) = C(z21 - G)'H 
z -1 o Po 
=[0 1 00 2 -1 0 
0.5 02 z-1.1 1 


1i 


1 
001 OTI 0208 e 


z BG) 


z’ - 1.12 + 0.2z +05 A(z) 
donde 


A(z) = 2? - 1.122 + 0.2z + 0.5 
B(2)=2 
En consecuencia, 
ay = -1.1, a: = 0.2, a = 0.5 
bo = 0, b, = 0, b: = 1, b; = 


En referencia a la figura 7-4, el diagrama de bloques para el presente sistema se puede dibujar como se 


muestra en la figura 7-20. 
El polinomio característico para el sistema completo (sistema con realimentación del estado ob- 


servado) es 


D(z) = H(z)F(z) = z: z? = z’ 
Por lo tanto, 
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Del diagrama bloques de la figura 7-20. la ecuación característica para el sistema es 
a(z)A(z) + B)B(2) = 0 
En consecuencia. en el enfoque de ecuaciones polinomiales se tiene 
a(2)A(2) + B(2)B(2) = H(2)F(2) 
o bien 


a(z)(z? — 1.12? + 0.27 + 0.5) + B(z)z = 2* 


Para determinar la función de transferencia pulso B(=)/a(=) del controlador. se resuelve esta ecuación 
Diofantina. 
Para el presente problema. n = 3 y la matriz de Sylvester E de 27 x 27 es de 6 ~ 6 como sigue: 


05 0 0 000 


o2 05 0 100 
m 00 07d. 0 
1 -11 02.0. 0 1 
0. 1 -11000 
0. 0 1.000 


e muestra a continuación. 


E? se puede obtener fácilmente mediante MATLAB. como 


un 










0 0 

0.2000 0.5000 O 1.0000 0 0 
1.1000 0.2000 0.5000 0 1.0000 0 
1.0000  -—1.1000 0.2000 0 0 1.0000 

0 1.0000  —1.1000 0 0 0 

0 0 0 








Para determinar a(z) y B(=). primero se define 


de 0 QA 

dí 0 qa; 

me dz ‘i 0 a A 
D= dl 7lol M= B- 
dı 0 Bı 

do 1 Bo 
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Yiz) 









Riz) 1 


z?-1.1z?+0.2z+0.5 





Aiz) 





Figura 7-20 Diagrama de bloques del sistema de control considerado en el problema A-7-7. 


y entonces M se determina como 
M=E`'D 


la cual se puede calcular fácilmente con MATLAB como sigue: 


D = [0;0;0;0;0;1); 
M = (inv(E)*D 








Ahora se determinan a(z) y B(z) como sigue: 
a(z) = &oz + az + 0=2*+1.12z 
B(2) = Boz? + Biz + R = 1.012? — 0.72z — 0.55 
Por lo tanto, el controlador diseñado es 
B(z) _ 1.012? — 0.722 — 0.55 
a(z) z? + 1.1z 


Observe que esta función de transferencia pulso es la misma que la de la ecuación (6-283), la función de 
transferencia pulso del controlador observador obtenido en el problema A-6-17. 
En referencia a la figura 7-20, la función de transferencia pulso en lazo cerrado es: 











PG) 
Y(2) °A(z) _ __ Koa(z)B(2) 
RG) i} BG) B(z) a(z)A(z) + B(z)B(2) 
a(z) A(z) 
_ Koa(z)B(z} _ Ko(z? + 1.1z)z  Ko(z + 1.1) 
HEF) z Ml 7 
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Observe que la cancelación de -* ocurre entre a(-)8(=) y H(=)F(2) y el sistema es de tercer orden. [El 
sistema podría haber sido de orden (2n — 1) (o de quinto orden) si no hubiera cancelación.] 
Para determinar la ganancia Kọ. se impone la condición de que la salida en estado estable y(%) a la 
entrada escalón unitario sea igual a uno, es decir. 
-1 Kz +11) z 


lim n y(k) = = lim =— z PES 


=2.1K,= 1 


Por lo tanto. 


Ko = 0.4762 


y la función de transferencia pulso en lazo cerrado es 


Y(2) _ 0.4762(z + 1. 1) _ 0.4762z + 0.5238 


R(2) ze 2? 
El sistema es de tercer orden. La respuesta del sistema diseñado al escalón unitario se muestra en la figura 
7-21. Observe que en la respuesta al escalón unitario la salida alcanza la unidad en tres períodos de 
muestreo. 
La respuesta del sistema diseñado a la rampa unitaria se presenta en la figura 7-22. El error al 
seguir la entrada rampa unitaria se puede calcular como sigue: 


E(2) = RG) - Y(2) = E lee ) 


A (1- 0.4762z + e328) Re ) 


- EZD? + z + 0.5238) e) 


z 


Respuesta escalón unitario 





dl pisa E uo e 


y ESE IU AL 


y(k) 








0 5 10 15 20 25 30 35 40 


k 
Figura 7-21 Respuesta al escalón unitario del sistema diseñado en el problema A-7-7. 
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Respuesta escalón unitario 











C E O E E E 
A i = Pg 
3 $ Z o 
3 P E 
7 o 
IRG O El 
3+ Pa o 
Y FA 
y o 
2.54 t ò 4 
E o 
ES 
2 A e al 
$ 2 7 x 
# 
Y o 
Sh. A AS 3 
a. o 
P4 E 
1+ riesia s a S 
P 2 
A” o 
0.5t e oa o bal 
Z o 
Pd 
Y -0 
Oia -0m E 4 i 
0 5 10 15 20 
k 


Figura 7-22 Respuesta a la rampa unitaria del sistema diseñado en el problema A-7-7. 


La entrada rampa unitaria R(z) está dada por 


Tz* 0.2z 
R(z) B a Es z`% ig (z gn 1y 
En consecuencia, 


z-1(2- 1)(z? + z + 0.5238) 0.22 


lim e(k) = lim—— = 
pe (k) Ai Z z? (z -17 
= 0.5048 
Por lo tanto, el error al seguir la entrada rampa unitaria es 0.5048, como se puede observar en la figura 


7-22. 
Problema A-7-8 


En referencia al problema A-7-7, considere la misma planta dada por las ecuaciones (7-26) y (7-27). 
(También refiérase al problema A-6-17.) Suponga que los polinomios H(z} y F(z) son los mismos que los 
utilizados en el problema A-7-7. 

Al emplear el enfoque polinomial, diseñe un sistema de control para la planta cuyo diagrama de 
bloques sea el mismo que el de la figura 7-5. Entonces obtenga la respuesta al escalón unitario y a la 
rampa unitaria del sistema diseñado. El período de muestreo T del sistema es 0.2 segundos. 


Solución Para este problema 


Ho =2Y, FG)=2 
En referencia al problema A-7-7, la función de transferencia pulso G,(z) de la planta es 
LE z _ B(z) 
e= 0 05 A(z) 
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El diagrama de bloques para el presente sistema se muestra en la figura 7-23. La ecuación Diofantina 
para este problema es 


a(z)A(2) + B(2)B(2) = H(2)F(2) 
o bien 
a(z)(z? — 1.12? + 0.2z + 0.5) + B(z)z = z5 
Esta ecuación Diofantina se resolvió en el problema A-7-7 y el resultado fue 
a(z) = 2? + 1.12 
B(2) = 1.012? — 0.722 — 0.55 
Por lo tanto, en referencia a la ecuación (7-12), la función de transferencia pulso Y(z)/R(z) está dada por 
YE) _ LB) 
R(z) H(2) 
o bien 
Y(2)_Koz_ Ko 


RO zz z 


Para determinar la ganancia Ko, se impone la condición de que la salida en estado estable y(%) a la entrada 
escalón unitario sea igual a uno, es decir, 








En consecuencia, 
Ko=1 
Por lo tanto, Y(=)/R(z) es 
YG) 1 
RG) 2 


El sistema diseñado es de segundo orden. La respuesta al escalón unitario del sistema diseñado se mues- 
tra en la figura 7-24. Observe que en la respuesta al escalón unitario la salida alcanza la unidad en dos 
períodos de muestreo. 





Figura 7-23 Diagrama de bloques del sistema de control considerado en el problema A-7-8. 
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Respuesta a la rampa unitaria 
1.6 ASA AO T ES a 12 y 





TAk ana : is horiei td: per cil ss nd a rad 


le.ooovonooó00009000000000900D00OAPAIRAIIAOA 











A O A 
Dto l 
oabr | 
0.2} l 
ot i aui Sa odo 

Qi S AO TAS EOT aa GO da oe 


k 
Figura 7-24 Respuesta al escalón unitario del sistema diseñado en el problema A-7-8. 


La respuesta a la rampa unitaria se presenta en la figura 7-25. El error al seguir a la entrada rampa 
unitaria se puede calcular como sigue: 


Elz) = R(z) - Y(z) = h: — rolko 


= ( — IRo = E Re) 


La entrada rampa unitaria R(z) es 


Tz" 0.2z 
R 2 == E 
(z) a-z% G-1 
En consecuencia, 


i . z—1(z-1X(z+1) 0.2z 
lim e(k) = lim —— ———— ~ =—= = 0. 
ko (E) z1 Z ze (z - 1y nd 
Por lo tanto, el error al seguir a la rampa unitaria es 0.4, como se puede observar en la figura 7-25. 
Al comparar los sistemas diseñados en los problemas A-7-7 y A-7-8, el último sistema que utiliza 


la configuración del diagrama de bloques de la figura 7-5 presenta un desempeño superior. 
Problema A-7-9 


Considere una planta definida por 


z+0.5 
Ce) = 327 0012 + 0.12 
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Respuesta al escalón unitario 
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Figura 7-25 Respuesta a la rampa unitaria del sistema diseñado en el problema A-7-8. 


El período de muestreo T es de un segundo. Suponga que en el presente problema es importante tener 
error de seguimiento cero a una entrada rampa unitaria. 
Se quiere diseñar un controlador tal que el sistema de contro! tenga un comportamiento como el 
del sistema modelo cuya función de transferencia es 
0.647 — 0.512 
Gmod = (22 12:40.52: 0.6) 


0.640.512 
21.87? +41,.24:-0.312 








(7-28) 


(El período de muestreo para este sistema también es un segundo.) Las respuestas al escalón unitario y a 
la rampa unitaria del sistema modelo G moacio Se presentan en la figura 7-26 y 7-27, respectivamente. (El 
error en estado estacionario al seguir una rampa unitaria es cero, y el sobrepaso máximo en la respuesta 
al escalón unitario es de alrededor de 70%.) 


Solución Se va a suponer que el diagrama de bloques del sistema es el mismo que el de la figura 7-9, 
Para la planta dada, 


A(z) = 2? — z? + 0.012 + 0.12 
B(z)=z+0.5 
Por lo tanto, 
a=-_l, a, = 0.01, a; = 0.12 
bo = 0, b,=0, b¿=1, b; =90.5 


il 
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Respuesta al escalón unitario 


POr doooo dao corn ono oo 


espana AS Sono 
ES A 


y(k) 
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Figura 7-26 Respuesta al escalón unitario del sistema modelo Goy dado por la ecuación (7-28). 


Respuesta a la rampa unitaria 


yik) 











Figura 7-27 Respuesta a la rampa unitaria del sistema modelo G maxi dado por la ecuación (7-28). 
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Es claro que no hay factores comunes entre A(z) y B(z). En este problema se puede seleccionar H(z) 
como 


H(z) = z? — 1.22 + 0.52 


Aquí se selecciona H,(=) para cancelar una parte del denominador de Gmoacio: [Pero esto no es necesario. 
El requisito sobre A,(=) es que debe ser un polinomio estable de grado n —1 (en este problema n = 3). 
Existe una infinidad de selecciones posibles para H,(=).] Se define 


H(z) = B(2)H, (2) 
= (z + 0.52? — 1.22 + 0.52) 
= 2? — 0.727 — 0.08z + 0.26 
Ahora se escoge a F(=) como 
F(z) = 2? 


[F(=) debe ser un polinomio estable de grado n — 1. En este caso, existe un sinnúmero de opciones.] 
Entonces D(z) es como sigue: 


D(z) = F(2)H(2) = F(2)B(2)H (2) 
= 2% - 0.77* — 0.082? + 0.262? 


Por lo tanto. 
d=1, d, = -0.7, də = —0.08, 


d; = 0.26, d, = 0, ds =0 
Ahora se necesita resolver la ecuación Diofantina siguiente: 
a(z)A(z) + B(z)B(2) = F(z)B(z)H:(2) 


o bien 
a(z)(z? — z? + 0.01z + 0.12) + B(zX(z + 0.5) = z5 — 0.72* — 0.082? + 0.262? 


La matriz Sylvester de E de 6 x 6 para este problema es 


a 0 0 b 0 0 
0 


a2 03 bz b3 0 

E = a 4d, a bi bz b; 

1 a a bo bi b: 

0 1 ar 0 bo b, 

0 1 0 0 bo 
0.12 0 0 0.5 0 0 
0.01 0.12 0 1 05 0 
1 0.01 0120 1 05 
A -1 0.01 0 0 1 
0 1 -1 0 0 0 
0 0 1 0 0 0 
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Mediante el uso de MATLAB, E”' se puede obtener como sigue. 





r 





E = 


0.1200 
0.0100 
— 1.0000 
1.0000 
0 

0 


inv(E) 
ans = 


3.8462 
0 

0 

2.9231 
5.7692 
3.8462 


Se definen 


0.1200 
0.0100 
— 1.0000 
1.0000 


1.9231 


—0.4615 
2.8846 
—1.9231 


ds 
da 
dz 
dz 
dı 
do 


Entonces el vector M se puede obtener de 


O 0.5000 
O 1.0000 
0.1200 0 
0.0100 0 
— 1.0000 0 
1.0000 0 
0.9615 0.4808 
0 0 
0 0 
0.2308 —0.1154 
0.4423 0.2212 
0.9615 0.5192 
0 
0 
0.26 
opos] M7 
-0.7 
1 
M=E"D 





M= 
0,1000 
0.3000 
1.0000 
0.0240 
0.1180 
0.3100 


D = (0;0;0.26;-0.08;-0.7;1]; 
M = (inv(E))*D 


0.5000 
1.0000 


0.2596 
1.0000 


—0.0623 
—0.1206 
0.7404 


R 2 
= N 


Qo 


P 


Bi 
Bo 


Los cálculos en MATLAB de esta ecuación se muestran a continuación. 








0.5000 
1.0000 


0.3702 
1.0000 
1.0000 
0.0888 
0.0697 
0.6198 





Capítulo 7 


Del vector M se obtiene los valores de las a y de las B. a(z) y B(z) se determinan como 


alz) = ao z? + az +a: = z? + 0.3z — 0.1 


B(2) = Boz? + Biz + B = 0.312? — 0.118z + 0.024 
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Al usar estos polinomios a(z) y B(z). Y(@V1(2) es: 
Ya) FEBR) 1 _ 1 
Como I{z)R(2) es 


F(z) (0.64z-0.512X(2? — 1.2z +0.52) 





= Gwa AE) S z 
R(=) (z> -1.2z+0.52)(z- 0.6) 
_ 0642-0512 
z—0.6 


La función de transferencia pulso M(=)/R(z) es 


Y(z) l 0.64z -0.512 
R(2) ~ z7—=12:z:+0.52 z-0.6 





== Caca 


El sistema de control mediante la igualación a un modelo diseñado tiene el diagrama de bloque que se 
presenta en la figura 7-28a). Este diagrama de bloques se puede simplificar como se muestran en las 
figuras 7-28b) y c). 









(0.647 - 0.5122? - 1.2z + 0.52) 
(2? - 1.22 + 0.52Mz - 0.6) 











z+0.5 
22 z? + 0.01z + 0.12 


0.31z? - 0.118z + 0.024 


z? 


(a) 






0.647 - 0.512 


0647-0512 1 
(z? - 1.22 + 0.52Mz - 0.6) 


z? -1.2z + 0.52 









z? -= 1.2z + 0.52 


(b) 









0.64z - 0.512 
(2? - 1.2z + 0.52)(z - 0.6) 


(c) 
Figura 7-28 a) Diagrama de bloques del sistema de control mediante la igualación a un modelo diseñado; b) y c) 
diagramas de bloques simplificados. 
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Como se estableció antes, Gnodao H(z) debe ser fisicamente realizable. El grado del polinomio 
numerador de Gmodcio H,(z) debe ser igual o menor que el grado del polinomio denominador de G nodcio 
H (2). Esto significa que para 


Y(z) _ B(z) polinomio en z de grado m 





U(z) z A(z) p polinomio en z de grado n 
donde A(z) y B(z) no tienen factores en común, y 


_ B,,(z) _ polinomio en z de grado m 
modelo — a 





A, (z) polinomio en z de grado n’ 


m 


se debe tener 
n—-m2n-m 


Si esta condición no se cumple, lo mejor es modificar Gmodclo para que esta condición se cumpla y se 
pueda aplicar el presente enfoque. 


PROBLEMAS 
Problema B-7-1 


Considere los polinomios A(z) y B(z) definidos por 
A(z) =z + a1z +a = (z pi Az = A2) = z?- (Ar + A2)Z + A14A2 
B(z) = biz + b2 = b(z — A) = bz — bh» 


donde b = b,. La matriz de Sylvester E se define como 


aa 0 b, 0 
_|4 4 bi b 
E=Sli a0 b 
0 1 0 0 


Muestre que el determinante de E se puede obtener por 
JEl = b?’(A1 — A3)(à2 — As) 


Problema B-7-2 


Considere la ecuación Diofantina siguiente: 
a(z)A(z) + B(z)B(z)=1 
donde 
A(z) = z? — 0.7z + 0.1 
B(z) = 2? + 0.2z — 0.24 
a(z) = æoz + 0 
B(z) = Boz + Bı 


Resuelva esta ecuación Diofantina para a(z) y B(z) y determine los coeficientes œp, %;, Bo y Bi- 
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Problema B-7-3 
Considere la planta Y(2/U(z), donde 
Y(z) _ B(2) 
U(z) A(z) 
Suponga que 4(2) es un polinomio mónico en z de grado n y que B(z) es un polinomio en z de grado m. 
Suponga también que no hay factores comunes entre A(z) y B(z); esto es, la planta es de estado comple- 


tamente controlable y completamente observable. 
Considere la siguiente ecuación Diofantina: 


Y(z)A(z) + B(2)B(2) = F(z)[H(z) - A(2)] 


donde H(z) es el polinomio característico deseado para la parte de ubicación de polos y que F(z) es el 
polinomio característico deseado para el observador de orden mínimo. [ H(z) es un polinomio mónico de 
grado m y F(z) es un polinomio de grado (n — 1).] 

Muestre que esta ecuación Diofantina se resuelve para B(z) y y(z), entonces al utilizar 


U(z) = -2 UE) =- PA Ye) 


se completará el sistema de regulación con realimentación del estado observado. 
Problema B-7-4 


En el ejemplo 7-3 se diseñó un sistema de control tal que la ecuación característica para la parte de 
ubicación de polos era 


H(z) = (z — 0.6 — j0.4)(z — 0.6 + j0.4) = z? — 1.2z + 0.52 
y el polinomio característico deseado para el observador de orden mínimo era 
F(z)=2 
La ecuación Diofantina dada por la ecuación (7-13) se resolvió y a(z) y B(z) se determinaron como sigue: 
a(z) = z + 0.32 
B(z) = 24z — 16 


La constante K, se determinó como 8. La figura 7-6a) muestra el sistema diseñado. 
Muestre que la señal de control u(k) puede estar dada por 


u(k) = —0.32u(k — 1) — 24y(k) + 16y(k — 1) + 8r(k), © k=1,2,3,... 
u(0) = —24y(0) + 8r(0) 
Dibuje una gráfica de u(k) contra k cuando la entrada r(k) es una secuencia de escalón unitario. 
Problema B-7-5 
Considere una planta definida por 


x(k + 1) = Gx(k) + Hu(k) 


y(k) = Cx(k) 
donde 
0 1 0 0 
G= 0 0 1l, H=]0], C=[1 0 0] 
0.16 0.84 0 1 


www.FreeLibros.me 


564 


Enfoque de ecuaciones polinomiales para el diseño de sistemas de control Capítulo 7 


La función de transferencia pulso para la planta se puede escribir como 
Y(z) _ BG) 
U(z) A(z) 
Determine los polinomios A(z) y B(z). 
Al emplear el enfoque de ecuaciones polinomiales, diseñe un sistema de contro! para la planta. Se 


desea que el diagrama de bloques del sistema diseñado sea el mismo que el de la figura 7-4. Al resolver 
la ecuación Diofantina 


a(z)A(z) + B(2)B(2) = F(z)H(z) 
suponga que H(z) y F(z) son, respectivamente, como sigue 
H(z)=z°,  F(z)=z? 


Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema de control diseñado. El periodo 
de muestreo T es de | segundo. 


Problema B-7-6 


Considere la misma planta que la del problema B-7-5. Al emplear el enfoque de ecuaciones polinomiales, 
diseñe un sistema de control para la planta. Utilice el diagrama de bloques de la figura 7-5. Suponga los 
siguientes H(z) y F(z): 

H(z) =z, FG)=z 


Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema de control diseñado. Suponga 
que el período de muestreo es 1 segundo. 


Problema B-7-7 


Considere la planta definida por 


x(k + 1) = Gx(k) + Hu(k) 


y(k) = Cx(k) 
donde 
0 0 -0.25 1 
G=]|1 0 0 i H=|¡0), Cc=[ 0 0 
0 1 0.5 1 


Diseñe un sistema de control para la planta. Para la parte de ubicación de polos, se desea tener tres polos 
de lazo cerrado en el origen, es decir, 


H(z) = 2° 
y para la ecuación característica del observador de orden minimo, se desea tener 
F(z) = 2 


Utilice el enfoque de ecuaciones polinomiales para el diseño. 


Problema B-7-8 


Considere la planta definida por 


Y(z) 0.6z + 0.5 
Ulz) (2-1) 
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Al usar el enfoque de ecuaciones polinomiales, para diseñar un sistema de contro! tal que el sistema se 
comporte como el modelo G mosco Siguiente: 


22-11 
C podie = 39 





Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema diseñado (que es el mismo que 
el modelo Guodeo). El período de muestreo Tes | segundo, 


Problema B-7-9 


Considere la planta definida por 
Y(z)  0.01873(z + 0.9356) 
U(z) (2 — 1)G — 0.8187) 





Al utilizar el enfoque de ecuaciones polinomiales, diseñe un sistema de control tal que el sistema se 
comporte como el modelo G moai Siguiente: 
0.32 
G Sca 
modlo EROS) 
Obtenga la respuesta al escalón unitario y a la rampa unitaria del sistema de control (que es el mismo que 
el modelo Gmoaio: El período de muestreo T es 0.2 segundos. 
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Sistemas de control 
óptimo cuadrático 

















8-1 INTRODUCCIÓN 


Los problemas de control óptimo son de gran interés para los ingenieros de control. Un sistema dė 
control óptimo —un sistema cuyo diseño “optima” (minimiza o maximiza, según sea el caso) 2. 
valor de una función seleccionada como el indice de desempeño— difiere de uno ideal en qué 
el primero es más alcanzable en presencia de restricciones físicas, mientras que el último bien puede 
ser un objetivo inalcanzable. 


Índices de desempeño. Al diseñar un sistema de control óptimo o un sistema regulador óp- 
timo, se necesita encontrar una regla para determinar la decisión de control presente, sujeta a ciertas 
restricciones, para minimizar alguna medida de la desviación de un comportamiento ideal. Dichz 
medida es provista, generalmente, por el índice de desempeño seleccionado que es una función cuy: 
valor se considera una indicación de qué tanto se parece el desempeño del sistema real al desempeñe 
deseado. En la mayoría de los casos, el comportamiento del sistema se hace óptimo al escoger e. 
vector de control u(k) de tal forma que el índice de desempeño se minimice (o maximice, dependier- 
do de la naturaleza del índice de desempeño seleccionado). La selección de un índice de desempeñe 
apropiado es importante porque, en alto grado, determina la naturaleza del sistema de control óptime 
resultante. Esto es, que el sistema resultante sea lineal, no lineal, estacionario, o variante en el tiem- 
po, dependerá de la forma del índice de desempeño. Por lo tanto, el ingeniero de control formula esté 
índice en base a los requisitos que el sistema debe cumplir y lo toma en cuenta para determinar .z 
naturaleza del sistema resultante. Los requisitos de diseño por lo regular no sólo incluyen especifica- 
ciones de desempeño, sino también, para asegurar que sea físicamente realizable, restringen la formz 
del control a utilizar. 


566 
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El proceso de optimación no sólo debe proveer leyes de control óptimo y configuraciones de 
los parámetros, sino también debe predecir la degradación en el desempeño debido a cualquier des- 
vío del valor mínimo (o máximo) de la función del índice de desempeño que resulta cuando se 
aplican leyes de control no óptimas. 

El escoger el índice de desempeño más apropiado para un problema dado es muy dificil, 
especialmente en sistemas complejos. El uso de la teoría de optimación en el diseño de sistemas ha 
sido problemático debido al conflicto entre la factibilidad analítica y la utilidad práctica al seleccio- 
nar el índice de desempeño. Es preferible que el criterio para un control óptimo se origine desde un 
punto de vista práctico y no matemático. En general, sin embargo, la selección de un índice de 
desempeño implica un compromiso entre una evaluación útil del desempeño del sistema y un pro- 
blema matemático. 


Formulación de los problemas de optimización. El problema de optimización de un sistema 
de control se puede formular si se tiene la siguiente información: 


Ecuaciones del sistema 
Clase de vectores de control permitidos 
Restricciones en el problema 


Índice de desempeño 


JO EA D A 


Parámetros del sistema 


La solución de un problema de control óptimo consiste en determinar el vector de control óptimo 
u(k) dentro de la clase de vectores de control permitidos. Este vector u(x) depende de 


1. La naturaleza del índice de desempeño 
2. La naturaleza de las restricciones 

3. El estado inicial o salida inicial 
4 


El estado deseado o salida deseada 


Excepto en algunos casos, el problema de control óptimo puede ser muy complicado para obtener 
una solución analítica por lo que se tiene que obtener una solución por computadora. 


Cuestiones concernientes a la existencia de las soluciones a los problemas de control 
óptimo. Se ha establecido que el problema de control óptimo, dada una condición inicial x(0), 
consiste en encontrar un vector de control permitido u(k) que transfiera al estado a la región deseada 
del espacio de estados y para el cual el índice de desempeño se minimiza. 

Es importante señalar que a veces una combinación particular de planta, estado deseado, índi- 
ce de desempeño y restricciones, hacen que un control óptimo sea imposible. Esto es cuestión de 
requerir un desempeño más allá de las capacidades físicas del sistema. 

Las cuestiones que tienen que ver con la existencia de un vector de control óptimo son impor- 
tantes, ya que sirven para informar al diseñador si un control óptimo es posible o no para un sistema 
determinado y dado un conjunto de restricciones. Dos de las cuestiones más importantes son aque- 
llas acerca de la controlabilidad y observabilidad, que fueron presentadas en el capítulo 6. 
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Comentarios acerca de los sistemas de control óptimo. El sistema cuyo diseño minimiza (o 
maximiza) el índice de desempeño seleccionado es, por definición, óptimo. Es evidente que el índice de 
desempeño, en realidad, determina la configuración del sistema. Es muy importante apuntar que un 
sistema de control que es óptimo bajo un índice de desempeño es, en general, no óptimo bajo otro 
índice de desempeño. Además, la realización en hardware de una ley de control óptimo en particular 
puede ser algo difícil y costosa. Así, puede ser inútil dedicar demasiados recursos para implantar un 
controlador óptimo que es el mejor en solamente algún sentido individual limitado. A menudo, un 
sistema de control se diseña para realizar una sola tarea que se especifica completamente de antema- 
no. En vez de esto, se diseña para realizar una tarea seleccionada en forma aleatoria a partir de un 
repertorio de tareas posibles. Entonces, en los sistemas prácticos, puede ser mejor buscar una ley de 
control óptimo aproximada que no esté atada rigidamente a un solo índice de desempeño. 

Estrictamente hablando, se debe tratar que un sistema de control óptimo obtenido en forma 
matemática dé, en la mayoría de los casos, el desempeño mas alto posible bajo el índice de desempe- 
ño dado y es más una herramienta de medición que un objetivo práctico. Además, antes de decidir si 
se construye un sistema de control óptimo o algo inferior más simple, se debe evaluar con cusco e! 
grado en el que el desempeño del sistema de control óptimo complejo excede al del subóptimo 
simple. Sólo si se puede justificar, no se debe construir un sistema de control óptimo extremadamen- 
te complicado y costoso. 

Una vez que el grado de desempeño máximo se encuentra mediante el uso de la teoría de 
control óptimo, se debe hacer un esfuerzo para diseñar un sistema simple que se acerque al óptimo. 
Con esto en mente, se construye un sistema físico prototipo, se prueba, y se modifica hasta que se 
obtiene un sistema satisfactorio que tenga características de desempeño cercanas a las del sistema de 
control óptimo que se ha trabajado en teoría. 

Los problemas de control óptimo que se pueden resolver en forma analítica, dan una buenz 
visión de las estructuras y algoritmos óptimos que se pueden aplicar a casos prácticos. Un ejemplo 
de un problema de control óptimo con solución analítica es el problema de control óptimo de siste- 
mas lineales basados en índices de desempeño cuadrático. Los índices de desempeño cuadrático har. 
sido muy utilizados en sistemas de control práctico como una medida del desempeño del sistema. 


Control óptimo cuadrático. Se considera un sistema de control definido por 
x(k + 1) = Gx(k) + Hu(k) 
donde 
x(k) = vector de estado (vector-n) 
u(k) = vector de control (vector-r) 
G = matriz den x n 
H = matriz de n x r 


En el problema de control óptimo cuadrático se desea determinar una ley para el vector de contro 
u(k) tal que un índice de desempeño cuadrático se minimice. 
Un ejemplo de un índice de desempeño cuadrático es 


J eS ASPE + Rul] 
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donde las matrices S y Q son matrices Hermíticas definidas positivas o semidefinidas positivas y R 
es una matriz Hermítica definida positiva. El primer término del lado derecho de esta última ecuación 
toma en cuenta la importancia del estado final. El primer término dentro de los corchetes de la 
sumatoria toma en cuenta la importancia relativa del error durante el proceso de control, y el segun- 
do término toma en cuenta el gasto de energía de la señal de control. Se supone que el vector de 
control u(A) no está restringido. 

En la sección 8-2 se demostrará que la ley de control óptimo está dada por: 


u(k) = -K(k)x(k) 


donde K(k) es una matriz de r x n variante en el tiempo. Si N = œ, entonces K(k) es una matriz 
constante de r x n. El diseño de sistemas de control basado en dichos índices de desempeño cuadrático 
depende de obtener la matriz K(k). 

La característica principal de una ley de control óptimo basada en un índice de desempeño 
cuadrático es que es una función lineal del vector de estados x(k). Dicha realimentación del estado 
requiere que todos los estados estén disponibles para realimentación. Por lo tanto es ventajoso repre- 
sentar al sistema en términos de las variables de estado medibles. Si no todas las variables de estado 
se pueden medir, se requiere estimar u observar las variables de estado no medibles. Entonces se 
utilizan las variables de estado estimadas u observadas para generar las señales de control óptimo. 

La ventaja de utilizar el esquema de control óptimo cuadrático es que el sistema diseñado será 
asintóticamente estable, excepto para algunos casos muy especiales. (Véase los problemas A-8-6 y 
A-8-7.) 

Existen diferentes enfoques para resolver los problemas de control óptimo cuadrático. En este 
capítulo se presenta un enfoque utilizado en general basado en la técnica de minimización emplean- 
do multiplicadores de Lagrange. Para el problema de control óptimo cuadrático en estado estaciona- 
rio, se presenta el enfoque de Liapunov. En la sección 8-3 se mostrará que existe una relación entre 
las funciones de Liapunov y los índices de desempeño cuadrático. 

Observe que cuando un sistema de control óptimo se diseña en el espacio de estados es impor- 
tante verificar las características de respuesta en frecuencia. Algunas veces, se necesita una compen- 
sación específica para efectos de ruido. Entonces llega a ser necesario modificar la configuración 
óptima y aceptar una configuración subóptima, o puede llegar a ser necesario modificar el índice de 
desempeño. 


Resumen del capítulo. La sección 8-1 presentó material introductorio. La sección 8-2 trata 
el problema de control óptimo cuadrático básico y su solución. La sección 8-3 se ocupa del problema 
de control óptimo cuadrático en estado estacionario. Aquí se incluye el enfoque de Liapunov para 
resolver el problema de control óptimo cuadrático. La sección 8-4 discute el control óptimo cuadrático 
de un sistema de seguimiento. 


8-2 CONTROL ÓPTIMO CUADRÁTICO 


Los problemas de control óptimo cuadrático se pueden resolver mediante muchos enfoques diferen- 

tes. En esta sección se resolverá el problema de control óptimo cuadrático básico mediante el méto- 

do convencional de minimización empleando los multiplicadores de Lagrange. 
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Problema de control óptimo cuadrático. El problema de control óptimo cuadrático se puede 
enunciar como sigue. Dado un sistema de control lineal de tiempo discreto 


x(k + 1) = Gx(k) + Hu(k), x(0) =c (8-1) 
donde se supone que es de estado completamente controlable y donde 


x(k) = vector de estado (vector-n) 
u(k) = vector de control (vector-r) 
G = matriz no singular de nx n 


H = matriz de n x r 


encuentre la secuencia de control óptima u(0), u(1), u(2), . . ., u(V— 1) que minimiza un índice de 
desempeño cuadrático. Un ejemplo de índice de desempeño cuadrático para un proceso de tiempo 
finito (0 < k < N) es 


J= Zx*(N)SX(N) + 32 [x*(k)Qx(k) + u*(k)Ru(k)] (8-2) 


donde 


Q = matriz Hermítica (o matriz real simétrica) definida 
positiva o semidefinida positiva de n x n 


R =matriz Hermítica (o matriz real simétrica) definida 
positiva de r x r 


S =matriz Hermítica (o matriz real simétrica) definida 
positiva o semidefinida positiva de n x n 


Las matrices Q, R y S se seleccionan para valorar la importancia relativa de la contribución en el 
desempeño debida al vector de estado x(k) (k=0, 1,2,..., N-— 1), al vector de control u(k) (k = 0, 
1,2,...,N=— 1), y al estado final x(N), respectivamente. 

El estado inicial del sistema está en un valor arbitrario x(0) = e. El estado final x(V) puede ser 
fijo, en cuyo caso el término 7 x*(N)Sx(N) se elimina del índice de desempeño de la ecuación (8-2) 
y en su lugar se impone la condición terminal x(V) = xy, donde x; es el estado terminal fijo. Si el 
estado terminal x(N) no es fijo, entonces el primer término en la ecuación (8-2) representa el peso de 
la contribución en el desempeño debida al estado final. Observe que en el problema de minimiza- 
ción, la inclusión del término + x*(M)Sx(N) en el índice de desempeño J implica que se desea que el 
estado final x(V) esté tan cerca del origen como sea posible. 


Solución mediante el método convencional empleando multiplicadores de Lagrange. El 
problema de control óptimo cuadrático es un problema de minimización que involucra una función 
de varias variables. Por lo tanto, se puede resolver por el método de minimización convencional. El 
problema de minimización sujeto a restricciones se puede resolver al añadir dichas restricciones a la 
función a minimizar mediante el uso de los multiplicadores de Lagrange. 

En el problema de minimización presente, se minimiza J que está dado por la ecuación (8-2), 
repetida como: 


È [x*(k)Qx(k) + u*(k)Ru(k)] (8-3) 


Ni 


JE Sx*(N)SX(N) + 
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cuando está sujeta a restricciones especificadas por la ecuación (8-1), 


x(k + 1) = Gx(k) + Hu(k) (8-4) 
donde k=0,1,2,...,N— 1, y donde la condición inicial del vector de estado se especifica como 
x(0) = e (8-5) 
Ahora, al emplear un conjunto de multiplicadores de Lagrange A(1), A(2), . - . , A(N), se define un nuevo 
índice de desempeño L como: 
N-1 


L= Zx" (N)Sx(N) F ¿2 er) + u*(«)Ru(k)] 


+A*(k + 1)[Gx(k) + Hu(k) — x(k + 1)] 
+ [Gx(k) + Hu(k) — x(k + 1)]*A(k + 1) (8-6) 


La razón para escribir los términos que involucran el multiplicador de Lagrange en la forma en que se 
muestra en la ecuación (8-6) es para asegurar que L = £*. (L es una cantidad escalar real.) Observe que 


M(O)[c — x(0)] + [e — x(0)]*A(0) 


se puede sumar al índice de desempeño Ł. Sin embargo, no se hará esto, para simplificar la presen- 
tación. Es bien sabido el hecho de que minimizar la función L definida por la ecuación (8-6) es 
equivalente a minimizar a J definida por la ecuación (8-3) cuando está sujeta a las mismas restriccio- 


nes definidas por la ecuación (8-4). 
Para minimizar la función L, se necesita diferenciar L respecto a cada uno de los componentes de 


los vectores x(k), u(k) y A(k) e igualar los resultados a cero. Sin embargo, desde el punto de vista 
computacional, es conveniente diferenciar a L respecto a x, (4), m, (X), y X; (K), donde y, (4), m, (k) y 


x, (K) son los complejos conjugados de x; (k), u; (k), y À; (k), respectivamente. (Observe que la señal 
y su complejo conjugado contienen la misma información matemática.) Por lo tanto, se tiene 


oL 








JO © Parik EN 
óL PA en i 
207% Ae knki 
ðL S aa 

a RA E ilr 


Estas ecuaciones son condiciones necesarias para que L tenga un mínimo. Observe que las expresio- 
nes simplificadas para las derivadas parciales anteriores son 


ðL 








0D BA (8-7) 
ðL 

ao NA (8-8) 
ðL n 

HO S k=1,2,...,N (8-9) 
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En referencia al Apéndice A (véanse los problemas A-7 y A-8) para la diferenciación parcial de 
formas cuadráticas complejas y bilineales con respecto a variables vectores, se tiene 


o * = Ooy = 
zz * AX=AX y de Ay = Ay 


Entonces, las ecuaciones (8-7), (8-8) y (8-9) se pueden obtener como: 











E =0:  Qx(k) + G*A(k + 1) - A(k)=0, k=1,2,...,N-1 (8-10) 
T =0 Sx(N) - A(N) = 0, (8-11) 
TS =0 Ru(k) + H*A(k +1)=0, k=0,1,...,N-1 (8-12) 
FT Gx(k — 1) + Hu(k — 1) - x(k)= 0, k=1,2,...,N (8-13) 


La ecuación (8-13) es simplemente, la ecuación de estados del sistema. La ecuación (8-11) especifica 
el valor final del multiplicador de Lagrange. Observe que el multiplicador de Lagrange A(X) se llama a 
menudo covector o vector adjunto. 

Ahora se simplificarán las ecuaciones obtenidas. De la ecuación (8-10) se tiene 


Mk) = Qx(k) + G*A(k +1)  k=1,2,3,...,.N -1 (8-14) 


con la condición final A(N) = Sx(N). Al resolver la ecuación (8-12) para u(k) y al observar que R“ existe, 
se obtiene 


u(k) = -R H*A(k +1)  k=0,1,2,...,N -1 (8-15) 
La ecuación (8-13) se puede rescribir como 
x(k + 1) = Gx(k) + Hu(k), k=0,1,2,...,N - 1 (8-16) 


que es simplemente la ecuación de estado. Al sustituir la ecuación (8-15) en la ecuación (8-16) resulta 
en 


x(k + 1) = Gx(k) - HR H*a(k + 1) (8-17) 


con la condición inicial x(0) = c. 

Para obtener la solución al problema de minimización, se necesitan resolver las ecuaciones 
(8-14) y (3-17) en forma simultánea. Observe que para el sistema de ecuaciones, la ecuación (3-16), la 
condición inicial x(0) está especificada, mientras que para la ecuación del multiplicador de Lagrange. 
la ecuación (8-14), la condición final AN) está especificada. Por lo tanto, el problema se convierte en 
un problema con dos puntos de valores en la frontera. 

Si el problema de dos puntos de valores en la frontera se resuelve, entonces el valor óptimo para 
el vector de estado y para el vector de multiplicadores de Lagrange se pueden determinar y el vector 
de control óptimo u(A) se puede obtener en la forma de lazo abierto. Sin embargo, si se emplea la 
ecuación de Riccati, el vector de control óptimo u(k) se puede obtener en la forma de lazo cerrado o 
realimentado: 
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u(k) = —K(k)x(k) 


donde K(k) es la matriz de realimentación de rx n. 

A continuación, se obtendrá el vector de control óptimo u(k) en la forma de lazo cerrado 
obteniendo, primero, la ecuación de Riccati. Al suponer que Mk) se puede escribir en la forma siguien- 
te: 


Mk) = P(k)x(k) (8-18) 


donde P(k) es una matriz Hermítica de n x n (o una matriz simétrica real de n x »). Al sustituir la 
ecuación (8-18) en la ecuación (8-14) resulta en 


P(k)x(k) = Qx(k) + G*P(k + 1)x(k + 1) (8-19) 
y al sustituir la ecuación (8-18) en la ecuación (8-17) da 
x(k + 1) = Gx(k) — HR” H*P(k + Dx(k + 1) (8-20) 


Observe que la ecuación (8-19) y (8-20) no involucra a A(k) y, por lo tanto, se ha eliminado AX). El 
proceso empleado aquí se llama transformación de Riccati. Dicha transformación es de una importan- 
cia extrema para resolver el problema de valores en la frontera con dos puntos. 

De la ecuación (8-20) se tiene 


[I + HR H*P(k + 1)]x(k + 1) = Gx(k) (821) 


Para sistemas de estado completamente controlable, se puede demostrar que P(k + 1) es definida 
positiva o semidefinida positiva. Para una matriz P(k + 1) al menos semidefinida positiva se tiene 


IL, + HR H*P(k + 1)| = |I, + H*P(k + 1)HR"!| = |I, + R` H*P(k + 1)H] 
= |R [|R + H*P(k + 1)H +0 
donde se utilizó la relación 
II, + AB| =—|L, + BA], A = matriz de n x n, B = matriz de rx n 


(Véase el apéndice A.) Así, la inversa de l + Hr’ H*P(k+ 1) existe. En consecuencia, la ecuación (8- 
21) se puede escribir como: 


x(k + 1) = [I + HR H*P(k + 1))*Gx(k) (8-22) 
Al sustituir la ecuación (8-22) en la ecuación (8-19), se obtiene 
P(k)x(k) = Qx(k) + G*P(k + 1)(1 + HR”! H*P(k + 1)] Gx(k) 
o bien 
{P(k) — Q — G*P(k + 1)(1 + HR H*P(k + 1))*Gix(k) = 0 
Esta última ecuación se debe cumplir para toda x(k). Por lo tanto, se debe tener 
P(k) = Q + G*P(k + 1)(1 + HR" *H*P(k + 1D] `° G (8-23) 


La ecuación (8-23) se puede modificar. Al utilizar el lema de inversión de matrices 


(A + BD)! = A — A`'B(I + DAB) DA” 
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y al hacer las sustituciones 

A =1, B = HR”, D = H*P(k + 1) 
se obtiene 

[I + HR H*P(k + 1)]' = I- HR [I + H*P(k + 1)HR JT H*P(k + 1) 
= I — HR + H*P(k + 1)H] ' H*P(k + 1) 
En consecuencia, la ecuación (8-23) se puede modificar a 
P(k) = Q + G*P(k + 1)G 

— G*P(k + 1)H[R + H*P(k + 1)H] 'H*P(k + 1)G (8-24) 
La ecuación (8-24) o su equivalente [tal como la ecuación (8-23)] se denomina ecuación de Riccati. En 
referencia a la ecuación (8-11) y (8-18), al observar que k = N se tiene 

P(N)x(N) = MN) = Sx(N) 
o bien 
P(N) =S (8-25) 


Por lo tanto, las ecuaciones (8-23) y (8-24) se pueden resolver hacia atrás desde A= N hasta k = 0. Esto 
es, se pueden obtener P(N), P(N — 1), . . . , P(0) al comenzar desde P(W), el cual es conocido. 

En referencia a las ecuaciones (8-14) y (8-18), el vector de control óptimo u(k), dado por la 
ecuación (8-15), se escribe como 


u(k) = ~R H*A(k + 1) = —R”H*(G*)"[A(k) — Qx(k)] 
= -R H*(G*)'[P(k) — QIx(k) = —K(k)x(k) (8-26) 


donde 
K(k) = R'H*(G*)'[P(k) - Q] (8-27) 

La ecuación (8-26) proporciona la forma en lazo cerrado, o forma realimentada, para el vector de control 
óptimo u(k). Observe que el vector de control óptimo es proporcional al vector de estado. 

Note que el vector de control óptimo u(k) se puede escribir de varias formas, En referencia a las 
ecuaciones (8-18) y (8-22), u(k) se puede escribir como 

u(k) = -R H*A(k + 1) = -R H*P(k + 1)x(k + 1) 

-R H*P(k + 1)(1 + HR” H*P(k + 1)]* Gx(k) 
-R H*[P7(k + 1) + HR *H*]"! Gx(k) 
= -K(k)x(k) 


l 


il 


(8-28) 


donde 
K(k) = R H*[P (k + 1) + HR 'H*] G (8-29) 


Una forma ligeramente diferente del. vector de control óptimo u(k) se puede dar como 
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u(k) = —[R + H*P(k + 1)H]? H*P(k + 1)Gx(k) 
= —K(k)x(k) (8-30) 
donde 
K(k) = [R + H*P(k + 1)H]* H*P(k + 1)G (8-31) 


La equivalencia entre las expresiones para el vector de control óptimo u(k) que están dadas por las 
ecuaciones (8-26), (8-28) y (8-30), se puede mostrar fácilmente; véase el problema A-8-1. 

Las ecuaciones (8-26), (8-28) y (8-30) indican claramente que la ley de control óptimo requiere la 
realimentación del vector de estado a través de la ganancia variable en el tiempo K(£). La figura 8-1 
muestra el esquema de control óptimo del sistema regulador basado en el índice de desempeño 
cuadrático. Es importante apuntar que la ganancia variante en el tiempo K(k) se puede calcular antes 
de que el proceso comience, una vez que la matriz de estados del sistema G, la matriz de control H, y 
las matrices de peso Q, R y S estén dadas. En consecuencia, K(k) se puede precalcular fuera de línea 
y almacenarse para su uso posterior. Observe que el estado inicial x(0) no entra en los cálculos para 
K(X). El vector de control óptimo u(A) en cada etapa se puede determinar inmediatamente al premultiplicar 
el vector de estado x(k) por —K(1). 

Observe que una propiedad de la matriz de ganancia de realimentación K(k) es que casi es 
constante, excepto cerca del fin del proceso en k = N. (Véase el ejemplo 8-1 y el problema A-8-3.) 


Evaluación del índice de desempeño mínimo. A continuación se evaluará el valor mínimo 
del índice de desempeño: 


MD min | ¿eS + +21 [x*(K)Qx(k) + "RA! 


Al premultiplicar ambos lados de la ecuación (8-19) por x*(k), se tiene 


x*(k)P()x(k) = x*(k)Qx(k) + x*(k)G*P(k + 1)x(k + 1) 


Precálculo 
de K(k) 





Figura 8-1 Sistema regulador óptimo basado en un índice de desempeño cuadrático. 


www.FreeLibros.me 


576 Sistemas de control óptimo cuadrático Capítulo 8 


Al sustituir la ecuación (8-21) en esta última ecuación, se obtiene 
x*(k)P(k)x(k) = x*(k)Qx(k) + x*(k + 1)[I + HR? H*P(k + 1)]*P(k + 1)x(k + 1) 
= x*(k)Qx(k) + x*(k + 1)[1 + P(k + 1)HR  H*]P(k + 1)x(k + 1) 
Por lo tanto, 
x*(k)Qx(k) = x*(k)P(k)x(k) — x*(k + 1)P(k + 1)x(k + 1) 
—x*(k + 1)P(k + 1)HR'H*P(k + 1)x(k + 1) (8-32) 
También, de las ecuaciones (8-15) y (8-18) se tiene 
u(k) = —R H*P(k + 1)x(k + 1) 
Por lo tanto, 
u*(k)Ru(k) = [-x*(k + 1)P(k + 1)HR*]R[-R” H*P(k + 1)x(k + 1)] 
= x*(k + 1)P(k + 1)HR 'H*P(k + 1)x(k + 1) (8-33) 
Al sumar las ecuaciones (8-32) y (8-33), se tiene 
x*(K)Qx(k) + u*(k)Ru(k) = x*(k)P(k)x(k) — x*(k + 1)P(k + 1)x(k +1) (8-34) 
Al sustituir la ecuación (3-34) en la ecuación (8-3), se tiene 


N-1 


Jan = FXNISX(N) + 5 È [OP (U)x(k) — x*(k + 1)P(k + 1)x(k + 1)] 


= : x*(N)Sx(N) + > [x*(0)P(0)x(0) —*DPOO + DP Ox() 
— x*(2)P(2)IxQ) + +++ + x(N — DPIN — Dx(N — 1) — x*(N)P(N)x(N)] 
= Zx*(N)SX(N) + > x*(0)P(0)x(0) E Sx"(N)P(N)X(N) (835) 
Observe que de la ecuación (8-25) se tiene P(M = S. En consecuencia, la ecuación (8-35) es 
Jan = =x*(O)P(0)x(0) (8-36) 


Así, el valor mínimo del índice de desempeño J está dado por la ecuación (8-36). Éste es función del 
P(0) y del estado inicial x(0). 


Ejemplo 8-1 


Considere el sistema de control de tiempo discreto definido por 
x(k + 1) = 0.3679x(k) + 0.6321u(k), x(0) = 1 


Determine la ley de control óptimo que minimiza el índice de desempeño siguiente: 


1 = FEOF + 5 È W + 0000] 
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Observe que en este ejemplo S = 1, Q = 1 y R = 1. También determine el valor mínimo del índice de 
desempeño J. 
En referencia a la ecuación (8-23), P(k) se obtiene como sigue: 


P(k) = 1 + (0.3679)P(k + 1)[1 + (0.6321)1(1)(0.6321)P(k + 1)]*(0.3679) 
que se puede simplificar a 
P(k) = 1 + 0.1354P(k + 1)[1 + 0.3996P(k + 1)]”” 
La condición de frontera para P(k) está especificada por la ecuación (8-25), y en este ejemplo 
P(N) = P (0) =S = 1 

Ahora se calcula P(k) de atrás hacia adelante desde k = 9 hasta k = 0: 

P(9) = 1 + 0,1354 x 1(1 + 0.3996 x 1)' = 1.0967 

P(8) = 1 + 0.1354 x 1.0967(1 + 0.3996 x 1.0967)7* = 1.1032 

P(T) = 1 + 0,1354 x 1.1032(1 + 0.3996 x 1.1032) * = 1.1036 

P(6) = 1 + 0.1354 x 1.1036(1 + 0.3996 x 1.1037)? = 1.1037 


P(k) = 1.1037, k=5,4,3,2,1,0 
Observe que los valores de P(k) se aproximan rápidamente al valor en estado estacionario. El valor en 
estado estacionario P,, se puede obtener de 


Ps = 1 + 0,1354P,,(1 + 0.3996P,,)* 


o bien 
0.3996P?, + 0.4650P,, - 1=0 


Al resolver esta última ecuación para P,,, se tiene 
P= 1.1037 o -2,2674 


Como P(k) debe ser positiva, se encuentra que el valor en estado estacionario de P(k) es 1.1037. 
La ganancia de realimentación K(k) se puede calcular de la ecuación (8-27): 


K(k) = (1)(0.6321)(0.3679) *[P(k) — 1] = 1.7181[P(x) — 1] 
Al sustituir los valores de P(k) obtenidos, se obtiene 
K(10) = 171811 -1)=0 
K(9) = 1.7181(1.0967 — 1) = 0.1662 
K(8) = 1.7181(1.1032 — 1) = 0.1773 
K(7) = 1.7181(1.1036 — 1) = 0.1781 
K(6) = K(5) = --- = K(0) = 0.1781 
La ley de control óptimo está dada por 
u(k) = —K(k)x(k) 
Ya que 
x(k + 1) = 0.3679x(k) + 0.6321u(k) = [0.3679 — 0.6321K(k)]x(k) 
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se obtiene 
x(1) = [0.3679 — 0.6321K(0)]x(0) 
= (0.3679 — 0.6321 x 0.1781) x 1 = 0.2553 
x(2) = (0.3679 — 0.6321 x 0.1781) x 0.2553 = 0.0652 
x(3) = (0.3679 — 0.6321 x 0.1781) x 0.0652 = 0.0166 
x(4) = (0.3679 — 0.6321 x 0.1781) x 0.0166 = 0.00424 
Los valores de x(k) para k = 5, 6, . . . , 10 se aproxima a cero rápidamente. 


Ahora, la secuencia de control óptimo u(k) se obtiene como sigue: 
u(0) = —K(0)x(0) = -0.1781 x 1 = —0.1781 
u(1) = —-K(Dx(1) = 0.1781 x 0.2553 = 0.0455 
u(2) = —K(2)x(2) = -0.1781 x 0.0652 = —0.0116 
u(3) = -K(3)x(3) = -0.1781 x 0.0166 = —0.00296 
u(4) = —K(4)x(4) = -0.1781 x 0.00424 = —0.000756 
u(k) =0, k=5,6,...,10 
Las gráficas de los valores de P(k), K(k), x(k) y u(k) se dibujan en la figura 8-2. Observe que los 


valores de P(k) y K(k) son constantes excepto para las etapas finales. 
Por último, el valor mínimo del índice de desempeño J se obtiene a partir de la ecuación (8-36: 


Jain = Le*(0)P(0)x(0) = ia x 1.1037 x 1) = 0.5518 


Ni 


Pik} K(k) 


¡o ...e. e. ..., 02 





u(k) 

x(k) 
0.1 
1.0 0 
0.5 -0.1 


-0.2 





Figura 8-2 Gráficas de P(k) contra k, x(k) contra k, y u(k) contra k K(k) contra k para el sistema considerado en 
el ejemplo 8-1. 
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Enfoque de MATLAB a la solución de este problema ejemplo. Un programa de MATLAB se 
puede escribir fácilmente para resolver este problema ejemplo. El programa 8-1 de MATLAB muestra un 
posible programa. [En este programa se utilizó la ecuación (8-24) para el cálculo de P(4).] 





Programa de MATLAB 8-1 





for i = N-1: -1: 1, 


p() = P; Pnext = P; 
end 
for i N: -1:1, 


ki} = K; 

end 

for i= 1:N-1, 
xnext = (G-H+*k(1))*x(i); 
x(i + 1) = xnext; 


end 
fori= 1:N, 

u(i) = ki); 
end 





K = inv(R)*H*inv(G')x(p(i) - Q); 


G = 0.3679; H = 0.6321; Q= 1; R= 1;s=1;x0= 1; 
N = 11; p(N) = S; x(1) = 1; Pnext = S; 


P = Q + G*PnexeG - G'*Pnext*H*inv(R+H '*Pnext*H}*H *Pnext*G; 




















Para imprimir los valores de PO, P1,..., P10 [que corresponden a p(1), p(2)},..., p11}, KO, K1,. 
. « , K10 [que corresponden a k(1), k(2),..., k(11)}, x0,x1,..., x10 [que corresponde a x(1), x(2), .. 
., X(11)), y u0, u1, ..., u10 [que corresponden a u(0), u(T), ..., u(TOJu(9), u(2)...., u(11)]. se 
introduce el comando de impresión como sigue. 
% *** Impresión de P, K, x y u ***** 
M=[p k x u] 
M= 
1.1037 0.1781 1.0000 -0.1781 
1.1037 0.1781 0.2553 —0.0455 
1.1037 0.1781 0.0652 -—0.0116 
1.1037 0.1781 0.0166 —0.0030 
1.1037 0.1781 0.0042 —0.0008 
1.1037 0.1781 0.0011 0.0002 
1.1037 0.1781 0.0003 —0.0000 
1.1036 0.1781 0.0001 —0.0000 
1.1032 0.1773 0.0000 —0.0000 
1.0967 0.1662 0.0000 —0.0000 
1.0000 O 0.0000 0 Ñ 
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La primera columna de la matriz, M proporciona desde arriba hacia abajo los valores de PO, 
P1,. .., P10. De la misma manera, la segunda, tercera y cuarta columnas proporcionan los valores de 
KO,K1,...,K70;x0,x1,...,x10;y00,u1,...,uTO; respectvamente. 


Problema de control óptimo cuadrático discreto. A continuación se considera el control 
óptimo cuadrático de un sistema de control discreto. Considere el sistema de control en tiempo 
continuo 


x = Ax + Bu (8-37) 
donde 
u(t) = u(kT), kTst<(k+1)T 
y el índice de desempeño a minimizar es 


J = ¿xx + i j 'K*CQXCE) + u*(ORu(o)] ar (8-38) 


Se supone que el sistema de control de tiempo continuo está aproximado por su equivalente discreto. 
La ecuación del sistema discretizado es 


x((k + 1)T) = G(T)x(kT) + H(T)u(kT) 


y el índice de desempeño discretizado cuando t, = NT se escribe como sigue: 


J= >x*(NT)SX*(NT) 


-13 Si [x*(KT)Q: x(kT) + 2x*(kT)Mi u(kT) + u*(kT)R, u(kT)] (8-39) 


Se observa que el término integral en la ecuación (8-38) no se reemplaza por 


LS PKT)OKET) + u*(KT)RU(KT)] 


pero se modifica para incluir un término cruzado que involucra a x(kT) y u(kT). También se modifican 
las matrices Q y R. A continuación, se considerará el problema de control óptimo discreto mediante el 
empleo de un ejemplo simple. 

Considere el sistema de tiempo continuo definido por 


X(t) = ax(t) + bu(t) (8-40) 


donde a y b son constantes y 
u(t) = u(kT), kT=st<(k+1)T 


El índice de desempeño a minimizar es 
1 oae 
J= 3x (NT) + zf [Qx (t) + Ru*(o)] dt (841) 
0 
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Se va a discretizar la ecuación del sistema y el índice de desempeño y se enunciará el problema de 
control óptimo cuadrático discreto. 
La ecuación (8-40) se puede discretizar como 


x((k + 197) = G(D)x(kT) + H(D)u(kT) 
donde 
G(T) = e" 


T 
H(T) = f eb dr = 2 por - 1) 


o bien 
x((k + 1)T) = e"x(kT) + 2 (par — 1u(xT) (8-42) 


El índice de desempeño J dado por la ecuación (8-41) se puede discretizar. Primero, J se rescribe así 


1 1 N-1 c(k+1)T 
L=EANT) +13 | [OPO + REG] 
2 2 ¿=07kT 
Al observar que la solución x(t) para ÁT < 1 < (k + 1)T se puede escribir de la siguiente manera 


x(t) = e Dx(kT) + | ed bu(r) dr 
È kT 


= (t — kD)x(kT) + n(t — kDu(kT) 
donde 
Elt — kT) = en 
n(t — kT) = Í élt — t)bdr = È fgat=rr) - 1] 
kT a 
el indice de desempeño J, se puede escribir como sigue: 


1 1X3 fær 
Y = 007) 433 | AOLE- KT)X(kT) + nle — KT) 
k=0 "kT 


+ Ru(kT)) dt 
(«+ DT 


= NT) + D f [QE — kT)? (kT) 


+2QE(t — kT)n(0 — kT)x(kT)u(kT) 
+ Ot — kT)u? (kT) + Ru?’ (kT)] dt 


N-1 


= FNT) + 33 [Ox (KT) + 2M, x(kT)u(kT) + R, u?(kT)] (8-43) 
k=0 
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donde 
(Kk+DT 
Q= | QPU- KT)dt 
kT 


(k+1)T 
M, = | QE — kT)n(t — kTD) dt 
kT 


(k+1)T 
R = f [Qn (t — kT) + R] dt 
kT 


Observe que Q,, M, y R, se pueden simplificar como sigue: 


(+ 1)T Q 
Q, = l Qet dt = Æ (e™ — 1) (8-H: 
kT 2a 
(k+1)T 
M, = | Qer-N È feat-kT) = 1] di = 2g "o 1y (845: 
kT a 
(k + 1)T b 2 
ref lofie i 
kT a 
- Le [(e? — 3 (e — 1) + 2aT] + RT (86: 


En resumen, el problema de control óptimo cuadrático discreto se puede enunciar como sigue. 
dada la ecuación de un sistema discretizado 


x((k + DT) = G(DIx(kT) + H(Du(kT) 
donde 
ame y H=- 


encuentre la secuencia de control óptima u(0), u(T), ..., U((N— 1)7) tal que el índice de desempeño 
siguiente se minimice: 


1 El 
J = 2=x UNT) + 2 
Tal índice de desempeño que incluye un término cruzado que involucra los términos x(AT) y u(r 
puede ser modificado a otra forma que no los incluya, y la solución del problema de control óptimo 
discreto se puede obtener de una manera similar a la del problema de control óptimo cuadrático 
presentada anteriormente en esta sección. Esta cuestión se presenta a continuación. 


a [Ox KT) + 2M,x(kT)u(kT) + R¡u(kT)] 


Índice de desempeño que incluye un término cruzado que involucra a x(k) y u(k). Ahora sè 
considera el problema de control óptimo cuadrático en donde el sistema es como el dado por lz 
ecuación (8-1), el cual fue 


x(k + 1) = Gx(k) + Hu(k), x(0) =c 


y el índice de desempeño está dado por 
N-1 
J= SX"(NISX(N) + 5 y [x*(k)Qx(k) + 2x*(k)Mu(k) + u*(k)Ru(k)] (847 
k=0 
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donde Q y S son matrices Hermíticas definidas positivas o semidefinidas positivas de n x n, R es una 
matriz Hermítica definida positiva de r x r, y M es una matriz de n x r tal que la matriz 


[n R] 
M* R 
es positiva definida. Esto significa que 
eo «ol. M] 
x*(k)Qx(k) + x*(k)Mu(k) + u*(«)M*x(k) + u*(k)Ru(k) 


x*(k)Qx(k) + 2x*(k)Mu(k) + u*(k)Ru(k) 
es definida positiva. Observe que el índice de desempeño J dado por la ecuación (8-47) incluye un 
término cruzado que involucra a x(k) y u(A). 

Para obtener el vector de control óptimo u(A), se define a 


1 


Ô = Q - MR M* (8-48) 
y al eliminar Q del índice de desempeño J. Entonces, la ecuación (8-47) es 
Pe ¿X"(N)SX(N) de PASO + MR- M*)x(k) 
+ 2x*(k)Mu(k) + u*(k)Ru(k)} 
2 F x*(N)Sx(N) + iS [x*(k)Ôx(k) + x*(k)MR-' M*x(k) 
+ 2x*(k)Mu(k) + u*(k)Ru(k)] 


= Ax*(N)Sx(N) + 3 2 be*(1)0x(k) 


+ [x*(K)MR + u*(«)]R[R* M*x(k) + u(k)]) (8-49) 
Se define 
v(k) = R'M*x(k) + u(k) (8-50) 
Entonces la ecuación (8-49) se puede escribir como sigue: 
N-1 
J= Sx*(N)Sx(N) + D [x*(k)ÂÔx(k) + v*(k)Rv(k)] (8-51) 
k=0 


Observe que la ecuación (8-51) ya no involucra el término cruzado. Efectivamente se ha eliminado el 


término cruzado que involucra a x(k) y u(k). 
Al sustituir la ecuación (8-50) en la ecuación del sistema, la ecuación (8-1), se obtiene 


x(k + 1) = Gx(k) + H[v(k) — R*M*x(k)] 
= (G - HR"'M*)x(k) + Hv(k) 
= Gx(k) + Hv(k) (8-52) 
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donde 
G=G-HR'M* (8-53) 


Observe que el control óptimo cuadrático del sistema dado por la ecuación (8-1) con el índice de 
desempeño dado por la ecuación (8-47) es equivalente al control óptimo cuadrático del sistema dado 
por la ecuación (8-52) con el índice de desempeño dado por la ecuación (8-51). Por lo tanto, el vector 
de control óptimo v(A) que minimiza el índice de desempeño dado por la ecuación (8-51) se puede dar 
como sigue. En referencia a las ecuaciones (8-26), (8-28) y (8-30), se tiene 


v(k) = ~R H*(Ĝ*) ~ [P(k) — Ô]x(k) (8-54) 
0 
v(k) = -R H*[ÎĤ-}(k + 1) + HR” H*]~' Ĝx(k) (8-55) 
o sea 
v(k) = —[R + H*P(k + 1)H]"H*D(k + 1)Ĝx(k) (8-56) 


donde P (k) es una versión modificada de la ecuación (8-23), es decir, 
P(k) = Q + Ĝ*Ê(k + 1)[1 + HR H*Ê(k + 1))"G, ÊN) =S (8-57) 
Entonces, el vector de control óptimo u(k) se puede dar como 
u(k) = v(k) — R M*x(k) (8-58) 


donde v(k) está dada por la ecuación (8-54), (8-55) y (8-56). Cualquiera que sea la expresión que se use 
para v(k), la ecuación (8-58) se puede reducir a la siguiente forma: 


u(k) = —[R + H*P(k + 1)H] "(H*P(k + 1)G + M*I]x(k) (8-591 
(Para detalles, véase el problema A-8-2.) 
Ejemplo 8-2 
Considere el sistema de control continuo 
ž(t)= —x(t) + u(e), x(0)=1 (8-60: 


donde 

u(t) = u(kT), kT<1t<(k + DT 
y el índice de desempeño 

1 1 NT 
J= ¿A NT) F zf [x (t) + u(t] dt (8-61: 
o 
donde T = 1 segundo y N = 10. Discretice la ecuación del sistema y el índice de desempeño. Entonces 
determine la secuencia de control óptimo u(kT) para k =0, 1,2,..., 9; ésta será la secuencia de control parz 
la cual el índice de desempeño es mínima. También, obtenga el valor mínimo de J. 
En referencia a las ecuaciones (8-40) y (8-42), la ecuación del sistema discretizado es 


x((k + 1)T) = eTx(kT) + P (eT — 1)u(kT) 
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donde a = —1. b = I y T = 1. Por lo tanto. la ecuación del sistema se convierte en 
x(k + 1) = 0.3679x(k) + 0.6321u(k), x(0) = 1 (8-62) 


La discretización del índice de desempeño es 
1 19 
Y = AAN) +5 2 [Qix (k) + 2M,x(kJu(k) + Rıu?(k)] (8-63) 
k=0 


donde O). M, y R, se obtienen al sustituir O = 1 y R = 1 en las ecuaciones (8-44). (8-45) y (8-46). 
respectivamente, como sigue: 


Los ds 2aT _ E N AÑ == 
ge 6 1) = (7? - 1) = 0.4323 


b 1 
M,= ze” - 1) = ze” - 1) = 0.1998 


2 
R= er = 3)X(e°7 — 1) + 2aT] + T 





“Ge 3)(e7! — 1) — 2] + 1 = 1.1681 


Así. el índice de desempeño dado por la ecuación (8-63) se puede escribir como sigue: 
9 
h= iedo) + P [0.4323x*(k) + 0.3996x(k)u(k) + 1.1681u*(k)] (8-64) 
k=0 


Por lo tanto. este problema se convierte como sigue. Dada la ecuación del sistema. ecuación (8-62). 
encuentre la secuencia de control óptimo (4). donde k = 0. 1.2..... 9 tal que el índice de desempeño dado 
por la ecuación (8-64) sea mínimo. 

Ahora al comparar las ecuaciones (8-47) y (8-64). se tiene 


S=1, O = 0.4323, M = 0.1998, R = 1.1681 


Observe que 


Q M|_ [0.4323 0.1998 
M* R 0.1998 1.1681 


es positiva definida. El siguiente paso es modificar J, dada por la ecuación (8-64) a la forma dada por la 
ecuación (8-51), ya que Q = Q- MR” M* = 0.3981. 


J = 5200) + 52 [0.3981x*(k) + 1.1681v*(k)] (8-65) 
k=0 


La señal de control óptimo u(k) se puede encontrar de la ecuación (8-58): 
u(k) = v(k) — R™' M*x(k) 
la cual se puede escribir en la forma dada por la ecuación (8-59): 
u(k) = —[R + H*P(k + 1)H] (H*P(k + 1)G + M*]x(k) (8-66) 
donde 
G = 0.3679 y H = 0.6321 


La ecuación (8-66) se puede reescribir como sigue: 
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u(k) = —[1.1681 + 0.3996P(k + 1)]*[0.2325P(k + 1) + 0.1998]x(k) 


_ _0.2325Ê(k + 1) + 0.1998 
1.1681 + 0.3996P(k + 1) 





x(k) = —K(k)x(k) 


donde 
K(k) = 0.2325P(k + 1) + 0.1998 
1.1681 + 0.3996P(k + 1) 
Observe que P (k) está dada por la ecuación (8-57), o bien, 
Ê(k) = Ô + Ĝ*P(k + D)[1 + HR H*P(k + DIG 

donde P(N)= P(10)=1 y 

Ô = Q - MR"'M* = 0.3981 . 

Ĝ = G - HR" M* = 0.3679 — 0.1081 = 0.2598 





La ecuación (8-69) se puede simplificar en la siguiente forma: 


0.06750P(k + 1) 


P(k) = 0.3981 + Sl 
1 + 0.3421P(k + 1) 


Capitulo 8 


(8-67) 


(8-68) 


(8-69) 


(8-70) 


Ahora se calculará P(k) con la condición de frontera P(10)=1. Al utilizar la ecuación (8-70), se 
encuentra P(k) hacia atrás desde k = 9 hasta k = 0. Los resultados se presentan en la tabla 8-1. Al utilizar 
los valores de P(k) así obtenidos, se calcula K(k) a partir de la ecuación (8-68). Los resultados también se 
presentan en la tabla 8-1. Ahora se calcula x(k). Al sustituir la ecuación (8-67) en la ecuación (8-62) y al 


eliminar u(k) de estas dos ecuaciones, se obtiene 


0.3035 


x(k + 1) = n ar 
1.1681 + 0.3996P(k + 1) 


(k)  x(0)=1 


Tabla 8-1 VALORES DE Ê (k), K(k), x(k), Y u(k) PARA EL SISTEMA 
CONSIDERADO EN EL EJEMPLO 8-2 





























K(k) x(k) u(k) 

0 0.4230 0.2230 1.0000 0.2230 
0,2230 0.2270 | —0.05062 
0.2230 0.05152 —0.01149 
0.2230 0.002653 —0.0005916 
















0.000602 —0.0001342 
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Al comenzar con x(0) = 1, los valores de x(k) se pueden caicular a partir de la ecuación (8-71) al utilizar los 
valores de (k) ya obtenidos. Los resultados se muestran en la tabla 8-1. Una vez que se obtienen los valores 
de K(k) y x(k). la señal de control óptimo 1(k) se puede obtener de la ecuación (8-67), o bien 


u(k) = —K(k)x(k) 


Estos resultados también se muestran en la tabla 8-1. 
Finalmente, en referencia a la ecuación (8-36), el valor mínimo de J, se puede obtener como sigue: 


Jimin = > P(0)x?(0) = 5 x 0.4230 x 1? = 0.2115 


Comentarios. El enfoque presentado aquí es útil para resolver un problema de control óptimo 
cuadrático de tiempo finito de un sistema de tiempo continuo mediante simulación en computadora. A 
menos que el índice de desempeño cuadrático de tiempo continuo dado se especifique claramente por 
alguna razón, es mejor definir un índice de desempeño cuadrático de tiempo discreto una vez que las 
ecuaciones del sistema se han discretizado. (Véase la sección 8-4.) 

Observe que en la mayoría de los casos las matrices S, Q y R en el índice de desempeño no son 
fijas, pero en “cierto sentido” son matrices definidas positivas escogidas en forma arbitraria; la 
minimización de un índice de desempeño arbitrario no tiene mucho sentido. Como se apuntó antes, la 
razón principal por la que el esquema de control óptimo cuadrático sea útil y se utilice con frecuencia 
es que produce un sistema de control asintóticamente estable, excepto en algunos casos académicos. 
(Véanse los problemas A-8-6 y A-8-7.) 


8-3 CONTROL ÓPTIMO CUADRÁTICO EN ESTADO ESTACIONARIO 


Se ha visto que cuando el proceso de control es finito (cuando ~N es finita), la matriz de ganancia de 
realimentación K(k) se convierte en una matriz variante en el tiempo. 

Ahora se considera el problema de control óptimo cuadrático cuando el proceso continúa sin 
limitaciones, o donde N = x= (esto es, cuando el proceso es uno de etapas infinitas). Como N se 
aproxima a infinito, la solución de control óptimo se convierte en una solución de estado estacionario, 
y la matriz de ganancia variante en el tiempo K(k) se convierte en una matriz de ganancia constante. 
Dicha matriz de ganancia constante K(k) se llama matriz de ganancia en estado estacionario y se 
escribe como K. 

A continuación, se considerará el control óptimo cuadrático en estado estacionario de un 
sistema regulador. La ecuación de la planta está dada por 


x(k + 1) = Gx(k) + Hu(k) (8-72) 
Para N= x, el índice de desempeño se puede modificar a 
j= D [x*(k)Qx(k) + u*(k)Ru(k)] (8-73) 
k=0 


El término + x*(N)Sx(N), que aparece en la ecuación (8-2), no está incluido en esta representación de 
J. Esto se debe a que, si el sistema regulador óptimo es estable de tal forma que el valor de J converge 
a una constante, x(>c) se hace cero y +x*(%)Sx(%) = 0. 
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Ahora la matriz en estado estacionario P(X) se define como P. Con referencia en la ecuación (8- 
23), la matriz P se puede determinar como sigue: 
P = Q + G*P( + HR 'H*P) 1G 
= Q + G*x(P? + HR H*) G (8-74) 


Es claro que la matriz P es determinada por la matrices G, H, Q y R. Una expresión ligeramente diferente 
para P se puede obtener de la ecuación (8-24): 


P = Q + G*PG — G*PH(R + H*PH) ' H*PG (8-75) 


La matriz de ganancia en estado estacionario K se puede obtener en términos de P como sigue: 
De la ecuación (8-27), 


K = RH*(G*) '((P — Q) (8-76) 
De la ecuación (8-29), 
K = R H*(P~ + HR 'H*)'G (8-77) 
Todavía es posible otra expresión para K. De la ecuación (8-31), 


K = (R + H*PH) ' H*PG (8-78) 


La ley de control óptimo para la operación en estado estacionario está dada por 


u(k) = —-Kx(k) 
Si por ejemplo, la ecuación (8-78) se sustituye en esta última ecuación, se obtiene 
u(k) = —(R + H*PH)' H*PGx(k) (8-79) 


y el sistema de control se convierte en un sistema regulador óptimo: 


x(k + 1) = [G — H(R + H*PH) ' H*PG]x(k) 
= (I + HR'H*P)' Gx(k) (8-80) 
donde se ha utilizado el lema de inversión de matrices, 
(A + BC)? = A? — A` B(I + CAB) CA 
con A =I, B=H y C = R” H’P. (Remítase al apéndice A.) 
El índice de desempeño J asociando la ley de control óptimo en estado estacionario se puede 
obtener de la ecuación (8-36) al sustituir P por P(0): 


1 
Join = ¿*(0)Px(0) (8-81) 
En mucho sistemas prácticos, en lugar de utilizar una matriz de ganancia variante en el tiempo 
K(k), se aproxima dicha matriz mediante la matriz constante K. Las desviaciones del desempeño 
óptimo debidas a la aproximación aparecerán sólo cerca del fin del proceso de control. 
Ecuación de Riccati en estado estacionario. Al implantar el controlador óptimo en estado 


estacionario (o invariante en el tiempo), se requiere la solución en estado estacionario de la ecuación 
de Riccati. Existen varias formas para obtener dicha solución. 
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Una forma es resolver la ecuación de Riccati en estado estacionario dada por la ecuación (8-75), 
P = Q + G*PG — G*PH(R + H*PH)'H*PG 


es comenzar con la ecuación de Riccaii en estado no estacionario, que fue dada en la ecuación (8-24): 


P(k) = Q + G*P(k + 1)G 
— G*P(k + 1)H[R + H*P(k + 1)H]"*H*P(k + 1)G (8-82) 


Al invertir la dirección del tiempo, se puede modificar la ecuación (8-82) a 
P(k + 1) = Q + G*P(k)G — G*P(X)H[(R + H*P(k)H] ' H*P(X)G (8-83) 


y comenzar la solución con P(0) = 0, e iterar la ecuación hasta obtener una solución en estado 
estacionario. Al calcular la solución numérica, es importante notar que la matriz P es una matriz 
Hermítica o real simétrica y es definida positiva. 

A continuación, primero se presentará un enfoque de MATLAB para resolver el problema de 
control óptimo cuadrático en estado estacionario. Después se estudiará otro enfoque basado en el 
método de Liapunov. 


Enfoque de MATLAB para resolver el problema de control óptimo cuadrático en estado 
estacionario. Ahora se considera un problema de ejemplo del control óptimo cuadrático en estado 
estacionario de un sistema regulador que se resuelve con MATLAB. 

Considere el sistema 


x(k + 1) = Gx(k) + Hu(k) 
donde 


El índice de desempeño J está dado por 
1 w 
J=53 Y [x'(K)Qx(k) + u'(k)Ru(k)] 
k=0 


donde 


-|1 0 a 
e=; N m 


La ley de control que minimiza a J puede estar dada por 


u(k) = —Kx(k) 


Determine la matriz de ganancia en estado estacionario K. 
El programa 8-2 de MATLAB resuelve este problema. Observe que MATLAB lleva a cabo la 
solución iterativa de 


P = Q + G'PG -— G'PH(R + H'PH)'H'PG 
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Programa de MATLAB 8-2 








Control óptimo cuadrático en estado estacionario—— 


Y, ***** Se resuelve la ecuación de Riccati en estado estacionario y se 
encuentra la matriz de ganancia de realimentación Óptima K***** 


% ****Marrices G, H, Q y R #7 
G = [0.2 0;0 0.4]; 
= [1,1]; 

=[1 00 0.5); 
= (1); 


H 
Q 
R 


% *** Se comienza con la solución de la ecuación de Riccati en estado 
estacionario 
% cuando P=[0 050 0p 


P=[0 00 0); 
P= Q + G*P*G a G *P*H*inv(R + HOPHYHP*G; 


% **** La solución P se revisa cada 10 o 20 pasos de iteración. 
o% La iteración se detiene cuando P permanece constante, ***** 


para i = 1:10, 
P=Q +0 PG - GC PH *inv(R + H *P*H)*H *P*G; 
end 


1.0252 
-0.0189 


para i= 1:10, 


P=Q+G"*P*G - G *P*Htinv(R + H*P*HJH*P*G; 
end 


1.0252 - 0.0189 
-0.0189 0.5724 


% **** La matriz P permanece constante. Por lo tanto, se ha alcanzado 
el estado estacionario. La matriz P en estado estacionario es ***** 
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ARA 


% *** La matriz de ganancia de realimentación Óptima K se obtiene de 
K = invíR + H"P*H)IH"*P*G 
K= 


0.0786 0 .0865 














con la condición límite 


0 0 
P hamn; 
0 0 
hasta que la solución alcance el estado estacionario. Entonces el programa 8-2 de MATLAB calcula la 
matriz de ganancia de realimentación óptima K empleando la ecuación siguiente: 
K = (R + H'PH) 'H'PG 
Enfoque de Liapunoyv para resolver el problema de control óptimo cuadrático en estado 
estacionario. A continuación se presentará el enfoque de Liapunov para resolver el problema de 


optimación de parámetros y el problema del regulador óptimo cuadrático en estado estacionario. 
Como se verá, existe una relación directa entre las funciones de Liapunov y los índices de desempeño 


cuadrático. 
Se considera el sistema 


x(k + 1) = Gx(k) (8-84) 


donde la matriz G involucra uno o más parámetros ajustables y cuyos valores propios están dentro del 
circulo unitario, o el origen x = 0 es asintóticamente estable. Se supone que se desea minimizar el 
índice de desempeño siguiente mediante el ajuste de un parámetro (o parámetros): 


yen Y x*(k)Qx(k) (8-85) 
2 k=0 


donde Q es una matriz Hermítica (o real simétrica) definida o semidefinida positiva. Ahora se mostrará 


que una función de Liapunov se puede utilizar para resolver este problema. 
Para el sistema de la ecuación (8-84), una función de Liapunov puede estar dada por 


V(x(k)) = x*(k)Px(k) 
donde P es una matriz Hermética definida positiva y 
AV(x(k)) = V(x(k + 1)) — V(x()) 
x*(k + 1)Px(k + 1) — x*(k)Px(k) 


Si se hace que 


x*(k)Qx(k) = -[x*(k + 1)Px(k + 1) — x*(k)Px(k)] (8-86) 


Observe que la ecuación (8-86) se puede rescribir como: 


www.FreeLibros.me 


592 Sistemas de control óptimo cuadrático Capítulo 8 


ll 


x*(k)Qx(k) = —([Gx(k)]*P[Gx(k)] — x*(k)Px(k)} 

—x*(k)[G*PG — Pix(k) 

Por el segundo método de Liapunov, se sabe que para una matriz dada Q existe una matriz P definida 
positiva, y como la matriz G es estable, entonces 


G*PG - P = -Q (8-87) 


En consecuencia, se puede determinar P a partir de esta ecuación. 
El indice de desempeño J se puede evaluar como sigue: 


E 2 0n0x(k) = > È [x*(kK)Px(k) — x*(k + 1)Px(k + 1)] 
= Zx*(0)Px(0) R 


donde P es una función del parámetro(s)ajustable(s). Al obtener la ecuación (8-88) se utilizó la condi- 
ción que x(%) > 0, ya que todos los valores propios de G están dentro del circulo unitario. Por lo 
tanto, el índice de desempeño J se puede obtener en términos del estado inicial x(0) y de la matriz P, la 
cual está relacionada con las matrices G y Q mediante la ecuación (8-87). La minimización del índice de 
desempeño J se puede realizar al minimizar x*(0)Px(0) con respecto al parámetro en cuestión. 

Es importante notar que el valor óptimo del parámetro depende, en general, de la condición 
inicial x(0). Sin embargo, si x(0) involucra sólo un componente no cero, por ejemplo, six,(0) + 0 y las 
otras condiciones iniciales son cero, entonces el valor óptimo del parámetro no depende del valor 
numérico de x,(0). 


Enfoque de Liapunov para resolver el problema de control óptimo cuadrático en estado 
estacionario. Ahora se considera el problema de control óptimo donde, dada la ecuación de la 
planta 


x(k + 1) = Gx(k) + Hu(k) (8-89) 
se desea determinar la matriz K de la ley de control óptima 
u(k) = —-Kx(k) (8-90) 
tal que el índice de desempeño 
= 1=52 [x*(k)Qx(k) + u*(«)Ru(k)] (8-91) 


se minimice, donde Q es una matriz Hermítica (o real simétrica) definida positiva o semidefinida 
positiva y R es una matriz Hermítica (o real simétrica) definida positiva. 
Al sustituir la ecuación (8-90) en la ecuación (8-89), se obtiene 


x(k + 1) = Gx(k) - HKx(k) = (G — HK)x(k) (8-92) 


Al sustituir la ecuación (8-90) en la ecuación (8-91) da 
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x 


ye È [x*(k)Qx(k) + x*(k)K*RKx(k)] 


= Ex" (XQ + K*RK)x(k) (8-93) 


En el análisis siguiente, se supone que la matriz G — HK es estable, es decir, los valores propios de G 
— HK están dentro del círculo unitario.(Si el sistema es completamente controlable y observable, se 
puede probar que G — HK es una matriz estable. Refiérase al problema B-8-6.) Entonces, existe una 
función de Liapunov que es definida positiva y cuya derivada es definida negativa. Siguiendo la 
discusión dada al resolver el problema de optimación de parámetros, se tiene 


x*(k)(Q + K*RK)x(k) = —[x*(k + 1)Px(k + 1) — x*(k)Px(k)] (8-94) 
En referencia a la ecuación (8-92), la ecuación (8-94) se puede modificar a 
x*(x)(Q + K*RK)x(k) = —[(G — HK)x(k)]*P[(G — HK)x(k)] + x*(k)Px(k) 
=x*(k)[(G — HK)*P(G — HK) — P]x(k) (8-95) 


Al comparar los dos lados de la ecuación (8-95) y al notar que esta ecuación permanece verdadera para 
cualquier x(k), se requiere que 


Q + K*RK = -(G — HK)*P(G — HK) + P (8-96) 


Observe que mediante el segundo método de Liapunov, para una matriz estable G — HK, existe una 
matriz P definida positiva que satisface la ecuación (8-96). 
La ecuación (8-96) se puede modificar como sigue: 


Q + K*RK + (G* — K*H*)P(G - HK) -P =0 
o bien 
Q + G*PG — P + K*(R + H*PH)K -— (K*H*PG + G*PHK) = 0 
Esta última ecuación se puede modificar como sigue: 
Q + G*PG — P + [(R + H*PH)'?K — (R + H*PH) "?H*PG]*-[(R + H*PH)?K 
— (R + H*PH) '?H*PG] — G*PH(R + H*PH) ' H*PG = 0 (8-97) 
La matriz K que minimiza a J se puede obtener al minimizar la parte izquierda de la ecuación (8-97) con 
respecto a K. (Véase el problema A-8-5.) Ya que 
[(R + H*PH)?K — (R + H*PH) ?2H*PG]*[(R + H*PH)'?K 
— (R + H*PH) "?H*PG] 
no es negativa, el mínimo ocurre cuando es cero, o cuando 
(R + H*PH)*K = (R + H*PH) ?H*PG 
Por lo tanto, se obtiene 


K = (R + H*PH) 'H*PG (8-98) 
pep E l 
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Al sustituir la ecuación (8-98) en la ecuación (8-97) se obtiene 
P = Q + G*PG — G*PH(R + H*PH) *H*PG (8-99) 


La matriz P debe satisfacer la ecuación (8-99), la cual es la misma que la ecuación (8-75). La ecuación 
(8-99) se puede modificar y obtener 


P = Q + G*P(I — H(I + R` H*PH)' R”'H*P]G (8-100) 
Mediante el uso del lema de inversión de matrices 
(I + HR? H*PY' = I - H(I + R H*PH) R H*P 
la ecuación (8-100) se puede modificar a 
P = Q + G*P(1 + HR~' H*P)' G (8-1011 


La matriz P se puede determinar de la ecuación (8-101). 
Por último, el valor mínimo de J se puede obtener como sigue. En referencia a las ecuaciones ($- 
93) y (8-94) y al notar que x(%) = 0, el valor mínimo del índice de desempeño J se obtiene como sigue: 


E 


Jun = 3 È (NQ + K*RK)x(k) 
= EII) — x(k + DP + 1) 
3 3x*(0)Px(0) 


Ejemplo 8-3 
Considere el sistema 
x(k + 1) — 1 1 x(k) x1(0) z 1 
x(k + 1) a =1||x{k)? x2(0) 0 
donde -0.25 < a < 0. Se desea determinar el valor óptimo de a tal que minimice el índice de desempeñ: 
siguiente: 


oo 


J = 3 È KOKK) 


donde Q = 1. 
De la ecuación (8-88), el índice de desempeño J en términos del parámetro a está dado por 


J= Fx (O)PxCO) 


donde P involucra el parámetro a. Ahora se determina P de la ecuación (8-87) 


G*PG - P = -Q 


o bien 
1 a Pu P: 1 1 —|Pu PRr|__ 1 0 
Lusg Pri Pza -1 Pu Pa 0 1 


la cual se puede simplificar a 
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2apr + a? pz pu+(a-=2)pw=apR|_|-1 0 
Pu + (a g 2)Pr2 = apn Pu T 2p: 0 -i 


Esta última ecuación resulta en las tres ecuaciones siguientes: 
2apı2 + a? prz =-] 
Pu + (a — 2)p12 — apn = 0 


Pur 2Pr2 = -1 
Al resolver estas tres ecuaciones para los p,, se obtiene 
_ 1+0.54 0.5(a — 1) 
P= a(1 + 0.54) a(l + 0.5a) 
0.5(a — 1) 1.5 


a(1 +0.5a)  a(l+0.5a) 


Ya que 0.25 <a < 0, P es definida positiva. 
El índice de desempeño J se convierte en 


1 1 Pu pelil 1 
J ==x*(0)Px(0) =7[1 0 == 
7 (0)Px(0) 5[ je pal 0 Les 
EEEE Lis 0.Sa? 
2a(1 + 0.54) 
El mínimo de J ocurre en el punto final a = —0.25. Por lo tanto, el valor mínimo de J se encuentra como 


1 + 0.5(-0.25) 


Jain = 2 — 0.5 x 0.25) 


= 2.3571 
Ejemplo 8-4 


Considere el sistema 


etajli deeh Rol-[i 
y el indice de desempeño 
J= e [x*(K)Qx(k) + u* (k)Ru(k)] 
donde Q= Iy R= 1. De la ecuación (8-98). la ley de control óptimo que minimiza el índice de desempeño 
J está dada por 
u(k) = —-Kx(k) = —(R + H*PH) ' H*PGx(k) 

donde la matriz P se puede obtener de la ecuación (8-101): 

P = Q + G*P(1 + HR "'H*P) 'G (8-102) 


Se determina la matriz P para el presente sistema. 
Observe que 
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que es no singular, se puede modificar la ecuación (8-102) a 
(P- Q)G (1 + HR *H*P) = G*P (8-103) 


La matriz P en este problema es una matriz real simétrica. En consecuencia. la ecuación (8-103) se puede 
escribir como: 


Pu Pn] 10 0 1 10 + 1 16 0] Pu Pi 2 1 1 Pri pr] 
Pu Pza 0 1 T e= 0 1 0 Pr Pz 10 Piz Pa 
o bien 
Pr(l + pun) piz +puı>l-prv -|Put+Ppa pr tpz 
(p2 — DA + pn) (Pz Dpu + pR — pn +1 Pii Pr 


Esta última ecuación produce cuatro ecuaciones escalares. Observe sin embargo. que sólo tres de ellas sor. 
linealmente independientes. Las cuatro ecuaciones escalares son: 


Pull + pu) 5 pu + Ppr 
Pia + pu — l- pr = prn +t pz 
(p2 = DA + pn) = Pu 


(pz ME Dpr + Pi 7 pz t 1= Ppr 
De la primera de estas cuatro ecuaciones, se obtiene 


pR=1 (8-104: 
y de la segunda de estas cuatro ecuaciones 
Pa=pm-2 (8-105: 
Entonces, de la tercera de las cuatro ecuaciones se tiene 
Pa- 3pu-3=0 (8-106 


[A] sustituir las ecuaciones (8-104) y (8-105) en la última de estas cuatro ecuaciones, se encuentra que ésiz 
siempre se satisface.] Al resolver la ecuación (8-106), se encuentra que 


pi =3.7913 o 0.7913 
ya que la matriz P debe ser definida positiva, se escoge que p,, = 3.7913. Entonces 
Pz = pn - 2 = 3.7913 - 2 = 1.7913 
En consecuencia, la matriz P es 


P= 3.7913 1.0000 
~ | 1.0000 1.7913 


8-4 CONTROL ÓPTIMO CUADRÁTICO DE UN SISTEMA DE SEGUIMIENTO 


En esta sección se discutirá el control óptimo cuadrático de un sistema de seguimiento. La planta 
considerada es el péndulo invertido mostrado en la figura 8-3. Se diseñará un esquema de control para 
este sistema de control de péndulo invertido. 

El péndulo invertido es inestable ya que puede caer en cualquier momento y hacia cualquier 
dirección a menos de que se le aplique una fuerza de control. Solamente se considera el problema er. 
dos dimensiones en el cual el péndulo sólo se nueve en el plano de la página. Se supone que la masa 
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2 cos 8 4 E 

















del péndulo se concentra al final de la varilla, como se presenta en la figura. (La varilla no tiene masa.) 
La fuerza de control u se aplica al carro. 

Es preferible mantener el péndulo invertido en posición vertical tanto como sea posible y 
mantener el control de la posición del carro, por ejemplo, mover el carro en forma de escalón. Para 
controlar la posición del carro, se necesita construir un sistema de seguimiento tipo 1. El sistema del 
péndulo invertido montado sobre un carro no tiene un integrador. Por ello, se alimenta la señal de 
posición y (la cual indica la posición del carro) de regreso a la entrada y se inserta un integrador en la 
trayectoria directa, como se muestra en la figura 8-4. (Observe que son posibles otras configuracio- 
nes.) Se escoge el periodo de muestreo T como 0.1 segundos. 

















Planta con realimentación del estado 





Figura 8-4 Diagrama de bloques del sistema de seguimiento. 
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El sistema de control a diseñar incluirá realimentación del estado y un integrador en el lazo 
cerrado. Las variables de diseño son la constante K, y la matriz de ganancia de realimentación K. Por 
lo tanto, el diseñar el esquema de control significa determinar la constante K, y la matriz K. Se resolverá 
este problema de diseño y se obtendrá la respuesta al escalón del sistema diseñado con ayuda de 
MATLAB. 

Para resolver este problema de diseño, primero se definen las variables de estado x4, x3, Xy Y X. 
como sigue: 


x=0 
x=0 
X, =x 
Xy = X 


En este sistema se quiere mantener el ángulo 0 tan pequeño como sea posible cuando el carro es 
movido en forma de escalón. Se considera que el desplazamiento del carro es la salida del sistema. Asi. 
la ecuación de salida es 


X1 

= X2 

y=|[0 0 1 0] x 

X4 

Se suponen los siguientes valores numéricos parar M, m y 1. 
M =2kg, m = 0.1 kg, 1=0.5m 


Para diseñar el sistema de control, se utilizará el modelo discretizado. La ecuaciones de estado 
y de salida discretas para la planta se pueden obtener como se muestra a continuación. (Refiérase al 
problema A-8-10 para obtener estas ecuaciones.) 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) + Du(k) 


donde 
1.1048 0.1035 0 0 0.0051 
o| 21316 11048 0 0 -| -0.1035 A B 
G=|_0.005 -00001 101 H5] 0005) CEO 10) D= [0 
-0.0508 -0.0025 0 1 0.0501 


De la figura 8-4 la representación en el espacio de estado para el sistema de control completo está dada 
por 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
v(k) = v(k — 1) + r(k) — y(k) 


dan u(k) = —Kx(k) + K,v(k) 


K = [k kə k3 ka] 
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Ya que 
v(k + 1) = v(k) + r(k + 1) — y(k + 1) 
= v(k) + r(k + 1) — C[Gx(k) + Hu(k)] 
= —CGx(k) + v(k) — CHu(k) + r(k + 1) 
se tiene 


x(k+1)|_ G 0] x(k) H 0 
e + y! y E T ls? EEN 
Se supone que la entrada r es una función escalón, es decir, 
r(k)=r(k+1)=r 


Entonces, cuando k se aproxima a infinito, 
Pol l-e Holt -eke [io 


xe(k) = x(k) — x(%) 
v(k) = v(k) — (eo) 


Entonces la ecuación del error se convierte en 
xe(k +1) E G 0 || x.(%) H 
e + 5) ES alles Fl ca 


u = E, + Kodo = UK Kc | 


Se define 


Observe que 


Ahora se define 
A G 0 a H A 
G= Las il H = Ea K=[K_-K];, w(k) = u.(k) 


Xie(k) 
(ko) 
- [0] - o 
soiw] 2 
Xse(k) 
donde x;, (Ak) = 1,(k). Entonces se tiene 


Elk + 1) = GE(k) + Hw(k) 
w(k) = —KE(k) 


Hay que señalar que como el sistema es continuo, se debe considerar un índice de desempeño 
cuadrático también continuo. Sin embargo, la discretización de un índice de desempeño continuo 
genera un término cruzado que involucra a ¢ y w.(Véase la sección 8-3.) Para simplificar el proceso de 
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diseño, es mejor definir un índice de desempeño cuadrático discreto. Por lo tanto, el problema se 
convierte en determinar la matriz K tal que minimice al siguiente índice de desempeño cuadrático: 


J = È [Qg + w'Rw] 


donde Q y R se deben escoger en forma apropiada para que la respuesta del sistema sea aceptable. (El 
propósito de utilizar el índice de desempeño cuadrático es asegurar la estabilidad del sistema.) 
Se escoge a Q y a R como sigue: 


10.0 000 
01 000 

Q=] 0 0 100 0 0|, R=(1 
00 010 
00 001 


El énfasis está en las variables de estado x,, y x,.. (Observe que se pueden utilizar diferentes valores 
de Q y R.) En el programa de MATLAB para resolver este problema, se utiliza la siguiente notación 


G1=G, Hi=Mñ  Kkk=K 


El programa 8-3 de MATLAB da la solución P para la ecuación de Riccati en estado estacionario, la 
matriz de realimentación K, y la constante de ganancia integral K,. 


A — AAA 92H a 
Programa de MATLAB 8-3 





Yo =~- Diseño de un sistema de control de péndulo invertido 
basado en la minimización de un índice de desempeño cuadrático —— 


% ***** El siguiente programa resuelve la ecuación de Riccati en estado 
estacionario y da la matriz de ganancia de realimentación óptima K ***** 


%***** Matrices G, H, C y D 


G = [1.1048 0.1035 0 
2.1316 1.1048 O 
-0.0025 -0.0001 1 
-0.0508 -0.0025 0 

H = [-0.0051 
-0.1035 
0.0025 
0.0501); 

C=(0 0 1 0); 

D= (o); 


1 
1); 


Yo "Matrices G1, HT, Q y RS 
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G1 = [G zerosí4, 1); -C* G 1]; 


H1 =[H; -C* H}; 
Q={10 0 0.00 
o 1 000 
0.0100 0 0 
0.0 10.0 
0.0 0 0 1) 
R= (1); 


Y ***** Se comienza a resolver la ecuación de Riccati en estado estacionario 
% para P cuando P = diag(0, 4) ***** 


P = diag(0, 4); 
P = Q + G1/*P*G1 - G1/*P*H1*inv(R + H1 P*H1)%H1 *P*G1; 


Y ***** Se revisa la solución de P cada 20 iteraciones. 
% La iteración se detiene cuando P permanece constante 


ARKAK 


para i = 1:20, 
P = Q+ G1*P*G1 - G1 *P*H1*inv(R + H1*P*H1)H1 *P*G 1; 
end 
P 
P= 
1.0e + 003* 
9.6887 2.1677 3.4319 2.4341 -0.1741 
2.1677 0.4876 0.7743 0.5490 -0.0393 
3.4319 0.7743 2.2988 1.1788 -0.1312 
2.4341 0.5490 1.1788 0.7824 -0.0625 
-0.1741 -0.0393 -0.1312 -0.0625 0.0185 
para i = 1:20, 
P = Q + G1*P*G1 - G1/*P*H1*inv({R + H1 *P*H1)H1 *P*G1; 
end 
P 
P= 
1.0e + 004 * 
1.0707 0.2397 0.3996 0.2772 -0.0220 
0.2397 0.0539 0.0902 0.0625 -0.0050 
0.3996 0.0902 0.2617 0.1367 -0.0158 
0.2772 0.0625 0.1367 0.0895 -0.0078 


~0.0220 -0.0050 -0.0158 -0.0078 0.0021 


para i = 1:20, 

P = Q + G1*P*G1 - G17*P*H1*inv(R + H1%P*H1)*H1 *P*G1; 
end 
P 
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P = 
1.0e + 004* 
1.0724 0.2401 0.4006 0.2778 -0.0221 
0.2401 0.0540 0.0904 0.0627 -0.0050 
0.4006 0.0904 0.2623 0.1371 -0.0158 
0.2778 0.0627 0,1371 0.0897 -0.0078 
-0.0221 -0.0050 -0.0158 -0.0078 0.0021 
para i = 1:20, 


P = Q+ G1P*G1 - G1/*P*H1*inv(R + H1 /*P*H1)*H17*P*G1,; 
end 
P 


1.03 + 004* 


1.0724 0.2401 0.4006 0.2778 -0.0221 


0.2401 0.0540 0.0904 0.0627 -0.0050 
0.4006 0.0904 0.2623 0.1371 -0.0158 
0.2778 0.0627 0.1371 0.0897 -0.0078 
-0.0221 -0.0050 -0.0158 -0.0078 0.0021 


of RRA 
% 


La matriz P permanece constante. Por lo tanto, se ha alcanzado 


ARA AA 


el estado estacionario. La matriz P en estado estacionario es 


P 

P= 

1.0e + 004* 
1.0724 0.2401 0.4006 0.2778 -0.0221 
0.2401 0.0540 0.0904 0.0627 -0.0050 
0.4006 0.0904 0.2623 0.1371 -0.0158 
0.2778 0.0627 0.1371 0.0897 ~0.0078 

-0.0221 -0.0050 -0.0158 -0.0078 0.0021 


EEEE ET 


% ***** La matriz de ganancia de realimentación óptima KK es 
KK = inv(R + H1*P*H1)*H1*P*G1 
KK = 

-64.9346 -14.4819 -10.8475 -9.2871 0.5189 
K = [KK(1) KK(2) KK(3) KK(4)] 
K= 


-64.9346 -14.4819 -10.8475 -9.2871 
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KI = -KK(5) 
KI = 


-0.5189 





Por lo tanto, la matriz de realimentación K y la constante de ganancia integral K, se determinan como 
sigue: 


K = [-64.9346 —14.4819 -—10.8475 -—9.2871], K, = -0.5189 
El diseño matemático está completo. 


Respuesta al escalón unitario del sistema diseñado. Para obtener la respuesta al escalón 
unitario, se procede como sigue: ya que 


x(k + 1) = Gx(k) + H[-Kx(k) + Kıv(k)] 
= (G — HK)x(k) + HK,v(k) 
v(k +1)=v(k)+r(k+1)-y(k+1) 
= v(k) + r(k + 1) — C[Gx(k) + Hu(k)] 
= (-CG + CHK)x(k) + (1 — CHK,)v(k) + r 


se obtiene 
lea a A z Eon? 1 Plo į Hi EBA 
y(k) = [€ | + [0] (8-108) 


donde r = 1. Para determinar la respuesta al escalón unitario y(k) (la posición del carro), primero se 
define 


6-0 HK, | 


CG + CHK 1- CHK, 


w[? 


CC=[C 0]=[0 0 1 0 0] 


DD = [D] = [0] 
y entonces las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-108)] se convierten a la 
función de transferencia pulso Y(=)/R(z) mediante el uso del siguiente comando de MATLAB: 


[num den] = ss2tf(GG,HH,CC,DD) 
Entonces se utiliza el comando filter: 
y = filter(num,den,r) 
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donde r = entrada escalón unitario. 
Para obtener la respuesta x,(k), se observa que 


x(k)=[1 0 0 0 | 


v(k) 
Se define 
FF=[(1 0 0 0 0] 
Entonces 
k 
x(k) = e | (8-109) 


Las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-109)] se convierten a la función de 
transferencia pulso X,(z)/R(z) mediante el comando 


[núm 1, den 1] = ss2tf(GG, HH, FF, DD) 
Entonces se utiliza el comando filter 
x1 = filterínúm 1, den 1, r) 


De forma similar, para obtener la respuesta de x,(k), se observa que 


xk) =[0 1 0 0 a] (8-110) 


Se define 
JJ=[0 1 0 0 0] 


Entonces las ecuaciones en el espacio de estado [ecuaciones (8-107) y (8-110)] se convierten a la 
función de transferencia pulso X(z)//R(z) mediante el comando 


(núm 2,den2] = ss2tf(GG,HH,3), DD) 


Entonces se utiliza el comando filter 


x2 = filter(num2,den2,r) 


De igual manera, al definir 


LL=[0 0 0 1 0] 
MM=[0 0 0 0 1] 


las respuestas x(k) y xs(k) = v(k) se pueden obtener empleando los comandos 


[núm 4, den 4] = ss2tf(GG, HH, LL, DD) 


x4 = filter(num4,den4,r) 
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[num5,den5] = ss2tf(GG, HH,MM,DD) 


x5 


filter(num5,den5,r) 


El programa 8-4 de MATLAB proporciona y(4), x(k), x(k), x(k) y xs(k) cuando la entrada es un 
escalón unitario (+ = 1). 








Programa de MATLAB 8-4 


% 





Respuesta al escalón del sistema diseñado —— 


Y ***** Este programa calcula la respuesta del sistema cuando está sujeto 

a una entrada de un escalón unitario. Los valores que se usan para K y K1 se 
calcularon en el programa de MATLAB 8-3. La respuesta se obtiene al usar 
el método de convertir las ecuaciones de estado en tiempo discreto en 

la forma de la función de transferencia de pulso. La respuesta se encuentra 
con el comando “filter” convencional ***** 


Y ***** Matrices K, K1, GG, HH, CC, FF, JJ, LL, MM, DD ***>** 


K = [-64.9346 -14.4819 -10.8475 -9.2871); 
KI = -0.5189; 

GG = [G-H*K_H*KI;-C*G + C*H*K 1-C*H*Kt); 
HH = [0; 0; 0; 0; 1); 

CC=[0 0 1 0 O; 

FF=([1 0 0 0 0); 

J={0 1 0 0 0) 

L=(0 0 0 1 0); 

MM=[0 0 0 0 1); 

DD = [0]; 


Y ***** Para obtener y(k) las ecuaciones en el espacio de estado 
se convierten a la función de transferencia pulso X3(z)/R(z) ***** 


[num, den] = ss2tf(GG, HH, CC, Dd); 


ARA 


Y% ***** Se introduce el comando para obtener la respuesta al escalón unitario 


r= ones (1, 101); 
axis ([O 100 -0.2 1.2)); 


k = 0:100; 

y = filter(num, den, r); 

plot(k, y, “0”, k, y, 1) 

grid 

title(' Position of Cart : y(k) = x3(k)”) 
xlabel('k') 


ylabel('y(k) = x3(k)') 


Y ***** Para obtener x1(k) las ecuaciones en el espacio de estado se 
convierten a la función de transferencia pulso X1(z)/R(z) ***** 





[num], den1] = ss2tf(GG, HH, FF, DD); 
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% ***** Se introduce el comando para obtener la respuesta al escalón unitario vd 
axis ([0 100 -0.1 0.2); 
x1 = filterlnum 1, den 1, r); 
plot (k, x1, “o”, k, x1, *-) 
grid 
title((Desplazamiento angular Theta: x1(k)') 
xlabel('k) 
ylabel('xT1(k) 
% ***** Para obtener x2(k) las ecuaciones en el espacio de estado 
se convierten a la función de transferencia pulso X2(z)/R(z)***** 
[num 2, den 2] = ss2tf(GG, HH, JJ, Dd); 
% ***** Se introduce el comando para obtener la respuesta al escalón unitario ***** 
axis([O 100 -0.5 0.5)); 
x2 = filter(num 2, den 2, r); 
plot (k, x2, “o”, k, x2, *-*) 
grid 
title (Velocidad angular Theta punto: x2(k)”) 
xlabel('k”) 
ylabel('x2(k)') 
Y ***** Para obtener x4([k) las ecuaciones en el espacio de estado 
se convierten a la función de transferencia pulso X4(z)/R(z) ***** 
[num 4, den 4] = ss2tf(GG, HH, LL, DD); 
% ***** Se introduce el comando para obtener la respuesta al escalón unitario raam 
axis([0 100 -0.5 1); 
x4 = filterínum 4, den 4, r); 
plot(k, x4, “0”, k, x4, 1) 
grid 
title (Velocidad del carro: x4(k)') 
xlabel (‘k’) 
ylabel((x4(k)) 
Y ***** Para obtener x5(k) las ecuaciones en el espacio de estado s 
e convierten a la función de transferencia pulso X5(z)/R(z) ***** 
[num 5, den 5] = s2tf(GG, HH, MM, DD); 
Y ***** Se introduce el comando para obtener la respuesta al escalón unitario ***** 
axis (f0 100 -5 30); 
x5 = filter(num 5, den 5, r); 
plot(k, x5, ʻo’, k, x5, *-*) 
grid 
title(*Salida del integrador: x5(k) = v(k)”) 
xlabel('k”) 
ylabel('x5(k) = v(k)') 
d 
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Con base en los cálculos de MATLAB, la posición del carro [y(k) contra k] se puede obtener 
como se muestra en la figura 8-5. (Nótese que el movimiento inicial de carro es en la dirección negati- 
va.) La figura 8-6 dibuja la gráfica del desplazamiento angular del péndulo, x,(x) = 6(k), en función de 


Posición del carro : y(k) = x3(k) 


yk) = x3(0 











to 


“0 10 20 30 40 50 60 70 80 90 100 
k 


Figura 8-5 Gráfica de la posición del carro y y(k) contra k. 





Desplazamiento angular theta: x Vik) 


0.2 


015p 


0.1 


x1(k) 


0.05 


-0.05(- 





0 10 20 30 40 50 60 70 80 90 100 


Figura 8-6 Gráfica del desplazamiento angular x,(4) contra A. 
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k. La figura 8-7 muestra la gráfica de la velocidad angular del péndulo, x,(X), en función de 4. La figura 
8-8 presenta la gráfica de la velocidad angular del carro, x,(X), en función de k. La salida del integrador. 
v(k) contra k, se presenta en la figura 8-9. 


x2(k) 


x4(k) 





Velocidad angular theta punto : x2(k) 





-0.4 } : ; ) 


0 10 20 30 40 50 60 70 80 90 100 


k 
Figura 8-7 Gráfica de la velocidad angular x(k) contra k. 








Velocidad del carro : x4(k) 
1 —— r p _— — e DE AA —_— —— 
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k 


Figura 8-8 Gráfica de la velocidad del carro x,(k) contra k. 
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Salida del integrador: x5(k)= : v(k) 





30 -= — ———= ——, == ES 


x5(k) = vík) 














-5 l dem dana- i AL _— 1 1 1 
0 10 20 30 40 50 60 70 80 90 100 
k 


Figura 8-9 Gráfica de la salida del integrador xk) contra A. 


Como en el sistema presente el periodo de muestreo Tes 0.1 segundos, toma alrededor 6 segundos 
alcanzar el estado estacionario. 


PROBLEMAS EJEMPLO Y SOLUCIONES 


Problema A-8-1 


Considere el sistema de control de tiempo discreto 
x(k + 1) = Gx(k) + Hu(k) 
donde 
x(k) = vector de estado (vector-n) 
u(k) = vector de control (vector-") 
G = matriz no singular de n x n 
H = matriz de n x r 
Se desea encontrar un vector de control óptimo tal que minimice el índice de desempeño siguiente: 
1 A 
J= 3 W)Sx(N) + 22 [x*(k)Qx(k) + u*(k)Ru(k)] 


donde Q y S son matrices Hermíticas definidas positivas o semidefinidas positivas de 1 x n y R es una 
matriz IHermítica definida positiva de r x z 
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En la sección 8-2 se obtuvo el vector de control óptimo u(k) en la forma dada por la ecuación (8-26) 


u(k) = -R' H*(G*)*[P(k) — Q]x(k) (8-111) 
donde P(k) está dada por las ecuaciones (8-23) y (8-25): 
P(k) = Q + G*P(k + 1)[I + HR H*P(k + 1) 'G,  P(N)=S (8-112) 
1. Muestre que el vector de control óptimo u(k) se modifica a 
u(k) = -R  H*[P7(k + 1) + HR ' H*]* Gx(k) (8-113) 
donde 
P(k) = Q + G*[P (k + 1) + HR 'H*]'G,  P(N)=S (8-114) 
2. Muestre que el vector de control óptimo u(k) también puede estar dado por 
u(k) = —[R + H*P(k + 1)H] 'H*P(k + 1)Gx(k) (8-115) 
donde 
P(k) = Q + G*P(k + 1)G 
— G*P(k + DH(R + H*P(k + 1)H] ` H*P(k + 1)G, P(N) =S (8-116) 


3. Muestre que las tres expresiones para P(k) dadas por las ecuaciones (8-112), (8-114) y (8-116) son 
equivalentes. 


Solución 
1. Primero se mostrará que las ecuaciones (8-111) y (8-113) son equivalentes. Con referencia a la 
ecuación (8-23) 
(G*) "[P(k) — Q} = (G*) 'G*P(k + 1)[I + HR ' H*P(k + 1) *G 
= P(k + 1)(1 + BR H*P(k + 1)] 'G 
= [P "(k + 1) + HR 'H*] 'G 
Por lo tanto. 


u(k) 


-R` H*(G*) "[P(k) — Qlx(k) 
-R` H*[P7(k + 1) + HR”' H*]7*Gx(k) 


y se ha mostrado que las ecuaciones (8-111) y (8-113) son equivalentes. 
2. Para mostrar que las ecuaciones (8-113) y (8-115) son equivalentes, observe que 


[R + H*P(k + 19H] 'H*P(k + 1)[P (k + 1) + HR 'H*] 
=[R + H*P(k + 1)H]*H*(I + P(k + 1)HR"' H*] 
=[R + H*P(k + 1)H]"[R + H*P(k + 1)H]R”' H* 
=R ` H* 
Por lo tanto 
R H*[P}(k + 1) + HR H*]? = [R + H*P(k + 1)H]' H*P(k + 1) 


y en consecuencia 
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u(k) 


li 


-R 'H*[P (k + 1) + HR *H*] * Gx(k) 


—[R + H*P(k + 19H] * H*P(k + 1)Gx(k) 
De esta manera, se ha mostrado que las ecuaciones (8-113) y (8-115) son equivalentes. 
3. A continuación. se probará que las ecuaciones (8-1 12) y (8-114) son equivalentes. Si se observa que 


P(k + 1)(1 + HR H*P(k + 19] * = (P Uk + 1) + BR H*]" 


entonces la equivalencia entre las ecuaciones (8-112) y (8-114) es aparente. 
Para mostrar que las ecuaciones (8-114) y (8-116) son equivalentes, observe que 


[P (k + 1) + HR H*KP(k + 1) — P(k + DH(R + H*P(k + 19H] "H*P(k + 1) 
=1 + HR 'H*P(k + 1) — HÍR + H*P(k + 1)H] ' H*P(k + 1) 
— HR 'H*P(k + DH(R + H*P(k + 1)H] ' H*P(k + 1) 
=1- H{-R' + [R + H*P(k + 1)H]* 
+R 'H*P(k + D)H(R + H*P(« + 1)H] ')H*P(k + 1) 
=] — H{[I + R'H*P(k + 1)H][R + H*P(k + 1)H] * — R'JH*P(k + 1) 
= I — H{R'[R + H*P(k + DH][R + H*P(k + 1)H]* — R H*P(k + 1) 
=] — HR” - R']JH*P(k + 1) = 1 
Por lo tanto, 
[P (k + 1) + HR 'H*]* 
= P(k + 1) — P(k + 1)H[R + H*P(k + DH] H*P(k + 1) 
y se tiene 
P(k) = Q + G*[P (k + 1) + HR 'H*] 'G 
=Q + G*P(k + 1)G — G*P(k + 1)H[R + H*P(k + 1)H] ' H*P(k + 1)G 
Por lo tanto, se ha mostrado que las ecuaciones (8-114) y (8-116) son equivalentes. 
Problema A-8-2 


Para el problema de control óptimo cuadrático donde el sistema está dado por la ecuación (8-1) y el índice 
de desempeño está dado por la ecuación (8-47), se encontró en la sección 8-2 que el vector de control 
óptimo u(k) puede estar dado por la ecuación 


u(k) = v(k) - R 'M*x(k) (8-117) 
donde v(k) está dada por la ecuación (8-54). (8-55) y (8-56) como sigue: 


v(k) = -RH*(G*) "[P(k) — Qx(k) 


o 

v(k) = RT H*[P "Uk + 1) + HR H*] *Gx(k) 
o 

v(k) = —[R + H*Ê(k + 1)H]'H*Ê(k + 1)Gx(k) (8-118) 
donde 


P(k) = Ô + G*P(k + D[I + HR H*P(k + D)'G,  Ê(N)=S 
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G=G-HRIM* y  Q=Q-MR'M* 
Muestre que el vector de control óptimo u(k) se puede expresar como sigue: 
u(k) = —[R + H*P(k + 1H] '[H*Ê(k + 1)G + M*]x(k) (8-119) 
Solución La equivalencia entre los lados derechos de las tres expresiones de v(k) se demostró en el 
problema A-8-1. De donde, se puede obtener la ecuación (8-119) si se emplea. por ejemplo, la ecuación (8- 
118) 
De las ecuaciones (8-117) y (8-118). se tiene 
u(k) = v(k) - R 'M*x(k) 
-[R + H*P(k + 1)H] ' H*P(k + 1)Gx(k) - R` M*x(k) 
-{[R + H*P(k + 1)H]' H*P(k + 1)[G - HR M*] 
+ [R + H*P(k + 1)H] [R + H*P(k + 1)H]R ' M*]x(k) 
-[R + H*P(k + 1)H] '[H*P(k + 1)G — H*P(k + 1)HR"' M* 
+ M* + H*P(k + 1)HR ' M*]x(k) 
—[R + H*P(k + 1)H] '[H*P(k + 1)G + M*]x(k) 
que es la ecuación (8-119) 


Problema A-8-3 


Considere el sistema de control de tiempo discreto definido por 


x(k + 1) = Gx(k) + Hu(k) 


cfi nf} «0-3 


Determine la secuencia de control óptimo u(k) que minimiza el índice de desempeño siguiente 


donde 


J= Zx (8)Sx(8) + 52 [x*(k)Qx(k) + u*(k)Ru(k)) 


(1.0 E 1.0 
esfo a} ren O 


Solución Con referencia a la ecuación (8-23), se tiene 


P(k) = Q + G*P(k + 1)[1 + HR`'H*P(k + 1)]'G 
(1001 [1 1 +D pek +1) 
0 1 1 Oll pi(k +1) paík +1) 


del eea reaa 
0 1 0 Ol pik +1) palk +1) 1 0 


La condición de frontera para P(k) está especificada por la ecuación (8-25) y está dado por 


donde 


P(N) = P(8) =S= E 4 
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Ahora se calcula P(k) de atrás hacia adelante desde P(7) hasta P(0): 


e=; JE JE AE i 
efe olo EG o 
ER 
rol; fi Ie aie l 


MESO T EEE 
0 00.5 1.5 1 0 
a a $ a 3.4286 0.8571 
$ 3)” | 0.8571 1.7143 
De forma similar, se pueden calcular P(5), P(4), . . ., P(0) como se presenta en la tabla 8-2, 


A continuación se determinará la matriz de ganancia de realimentación K(k). Con referencia a la 
ecuación (3-27), la matriz K(k) puede estar dada por: 


K(k) = R*HXxG*)[P(K) - Q] 
=p ali - 


-1 
TABLA 8-2 TABLA QUE MUESTRA P(k), K(k), x(k) Y u(k) PARA k =0, 1, 
2,...,8, RESPECTIVAMENTE, PARA EL SISTEMA CONSIDERADO EN EL 


PROBLEMA A-8-3 

P(k) K(k) 
3.7913 1.0000 
Es Pa] [1.0000 0.7913] 


3.7911 0.9999 
0.9999 1.7913 







k x(k) u(k) 


an 
allit 


rm 
Dm 


EE 









[0.9999 0.7913] 0.7913 


| 
sere 
3 E 
[an] 
00 
~d 
O y PEER E IES) 


[0.9997 0.7911] -0.2087 


3 


3.7905 0.9997 
0.9997 1.7911 


[0.9986 0.7905] -0.1651 





E A 
o 


3.7877 0.9986 
0.9986 1.7905 


o 
N 
© 
00 
QQ» 





199 E7 [0.9932 0.7877] 


3.7097 0.9677 
es | [0:9677 0.1194] 


(e ea} 
Sa |o>s f 
SER 
O 
=. n 
La 
l 
= 
BB 
w 
un 


Eo 1787 | 


0.0342 





SS 


E 
oo 
Y 

U 


—0.0087 





3.4286 0.8571 

[an mas] [0.8571 0.7143] l 
2.5000 0.5000 0.0015 
[53000 1300] 19:5000.: 0000) [0.0059] 
1.0000 0.0000 0.0057 
[o 1.0000 | 10:0000. 0:0000] [0.0013] 






0.0057 


E 
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A A a] 
= [pu(k) pz(k)- 1] 
Por lo tanto, 
K(8) = [pr(8) paa(8) — 1] = [0.0000 0.0000] 
K(7) = [pi2(7) pz2(7) — 1] = [0.5000 0.5000] 
De forma similar, se pueden calcular K(6), K(5), . . - , K(0) para dar los valores que se presentan en la tabla 
Epa A continuación, se calculará x(k). Se escribe 
K(k) = [ki(k) k2(k)] 
Entonces 


x(k + 1) = Gx(k) + Hu(k) 
= [G - HK(k)]x(k) 


z k - kk) 1- al Ese] 
1 0 x(k) 


o-[i 


x(k), donde k = 1, 2, .. . , 8, se puede obtener como sigue: 


_Fi-1 1-079131] [0.0000 
D=] 1 0 eE] 


Ya que el estado inicial es 


x(2) = 1 — 0,9999 1 — 0.7913 || 0.0000 - | 0.2087 
1 0 1.0000 0.0000 
De igual manera, se pueden calcular x(3), x(4), . . . , x(8). Estos resultados se muestran en la tabla 8-2. 


Finalmente, la secuencia de control óptimo u(k) se puede obtener de la ecuación (3-28): 
u(k) = -K(k)x(k) 


Esto es, 


u(0) = -K(0)x(0) = —[1 079131 4] = 1.0000 


u(1) = —K(1)x(1) = —[0.9999 oma] = —0.7913 


De forma similar, se pueden calcular u(2), u(3), . . . , u(8) para dar los valores mostrados en la tabla 8-2 
Como se mencionó antes, la matriz de ganancia de realimentación K(k) es constante excepto para los 
últimos valores de k. Esto significa que si el número de etapas no es 8 sino 100 entonces K(0), K(1)... 
, K(93) serán constantes y K(94), K(95), . . . , K(100) variarán. Este hecho es importante, porque si e: 
número de etapas N es suficientemente grande, entonces la matriz de ganancia de realimentación sè 
convierte en una matriz constante y, por lo tanto, el diseñador es capaz de emplear una matriz de gananc:z 
de realimentación constante para aproximar a la matriz de ganancia óptima variante en el tiempo. 
El valor mínimo de J se obtiene de la ecuación (8-36) como sigue: 


O reto 


= 1.8956 
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Con referencia al problema A-8-3, resuelva el problema con MATLAB, Escriba un programa en MATLAB 


para encontrar P(4), K(k), x(k) y u(k). Imprima P(X), K(4), x(k) y u(k). 


Solución El programa 8-5 de MATLAB muestra una posibilidad para resolver el problema 


Programa de MATLAB 8-5 


% Control óptimo cuadrático —— 





% ***** Se resuelve la ecuación de Riccati y se encuentra la matriz 
de ganancia de realimentación óptima K ***** 


% ***** Matrices G, H, S, Q y R ***** 


G=[1 1;1 0); 
H = [1; 0); 

S=[1 00 1); 
Q=|[1 00 1) 


R = (1); 


% ***** x0 = [1; 0], N= 9, p11(N)= 1, p12(N) = 0, 
% p22(N) = 1, x1(1)= 1, x2(1) = 0, Se introducen Pnext = S ***** 


x0 = [1; 0]; N = 9; 
p11(N) = 1; p12(N) = 0; p22(N) = 1; x1(1) = 1; x2(1) = 0; Pnext = S; 


kkkkk 


% ***** Comienza la solución de la ecuación de Riccati 


foriN - 1: -1:1, 
P = Q + GC *Pnext'inv(eye(2) + H*inv(R)"H"*Pnext)*G; 
p11() =P(1, 1); p12(i) = P(1, 2); p22(i) = P(2, 2); Pnext = P; 
end 


% ***** La matriz de ganancia de realimentación óptima K se obtiene de 
fori=N:- 1: 1, 

K = inv(R)*H *inv(G)*([p11() p12(); p12(i) p22()] - Q); 

k1() = K(D); k2(1) = K(2); 


end 


% ***** El control u(k) se obtiene de ***** 





for1=1:N-1, 
xnext = (G - H*[k1()  k2(0)"Rc1 (1); 2(i)); 
x1(1 + 1) = xnext(1); x2(i ^1) = xnext(2); 


end 
fori=1:N, 

u(i) = -[k1() k2(i)]*[x1 (i); x2(i)]; 
end 
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Al emplear este programa, la matriz P, la matriz K, el vector x y el vector u se pueden obtener como se 
muestra a continuación 


P= 


3.7913 
1.0000 
1.0000 
1.7913 


2.5000 
0.5000 
0.5000 
1.5000 


K = [k1;k2]' 
K= 


1.0000 
0.9999 
0.9997 
0.9986 
0.9932 
0.9677 
0.8571 
0.5000 

0 


x = [x1;x2] 


x= 


0 





% ***** Impresión de P, K, x, y u 


P = [p11;p12;p12;p22] 


Columns 1 through 7 


3.7911 
0.9999 
0.9999 
1.7913 


Columns 8 through 9 


1.0000 
0 
0 
1.0000 


0.7913 
0.7913 
0.7911 
0.7905 
0.7877 
0.7742 
0.7143 
0.5000 

0 


Columns 1 through 7 


1.0000 


KK 


3.7905 3,7877 
0.9997 0.9986 
0.9997 0.9986 
1.7911 1.7905 


1.0000 0.0000 0.2087 0.0001 


0.0000 0.2087 
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3.7740 
0.9932 
0.9932 
1.7877 


0.0437 
0.0001 


3.7097 
0.9677 
0.9677 
1.7742 


0.0003 
0.0437 





3.4286 
0.8571 
0.8571 
1.7143 


0.0099 
0.0003 
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Columns 8 through 9 


0.0015 0.0057 
0.0099 0.0015 








En esta impresión, PO, P1,..., P8 están dados como vectores columna. La primer columna de la matriz 
P da PO, la segunda da P1, y así sucesivamente. En cada columna el primer renglón da p11, el segundo y 
tercero dan p12, y el cuarto p22. KO, KT,..., K8 están dados como vectores renglón en la matriz K. El 
primer renglón corresponde a KO y el último aK8.x0, x1, . . . , x8 están dados como columnas de la matriz 
x. La primer columna corresponde a x0 y la última corresponde a x8. u0, ul, ..., u8 están dados como 
el primero, segundo, . . . , noveno renglón del vector u. 


Problema A-8-5 


Considere el sistema de control escalar 


x(k + 1) = gx(k) + hu(k) (8-120) 
y el índice de desempeño 
12 
J =5 È [gx (k) + ru?(k)] (8-121) 
k=0 


donde q > 0 y r > 0. En la sección 8-3 se mostró que la ley de control óptimo que minimiza el índice de 
desempeño J puede estar dada por 


u(k) = —Kx(k) (8-122) 
Al sustituir la ecuación (8-122) en la ecuación (8-120), se obtiene, 
x(k + 1) = (g — AK)x(k) (8-123) 


Al sustituir la ecuación (8-122) en la ecuación (8-121), se tiene 
E 
J=2Y (q +rK3xUk) 
2 zo 


Al emplear el enfoque de Liapunov y con referencia a la ecuación (8-94), se establece que 


(q + rK’°)?(k) = -[px°(k + 1) — px(k)] (8-124) 
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Al sustituir la ecuación (8-123) en fa ecuación (8-124), se obtiene 


(q + rK xk) = [-p(g — RKY + p]x(k) 


[q + rK? + p(g — hK} — p]x(k) = 0 
Esta última ecuación se debe mantener para cualquier x(k), De donde, se requiere que 
q +rK + p(g -hKY-=p=0 (8-125) 
Muestre que la ley de control óptimo se puede dar por 


u(k) = —Kx(k) = —ghplr + ph?) ` x(k) 


o 
K = ghp(r + ph)” (8-126) 

También muestre que p se puede determinar como una raíz positiva de la siguiente ecuación: 
q-p+grplr+ph)ì'=0 (8-127) 
Solución Con referencia a la ecuación (8-88), el índice de desempeño J se puede determinar como sigue: 

J =} px°(0) 
Para minimizar el valor de J para un valor dado x(0) con respecto a K, se tiene 

2 =0 (8-128) 


donde p está dado por la ecuación (8-125). Observe que en la ecuación (8-125) q + rK? > 0. De donde, 
1 — (2 - hKY + 0. Por lo tanto, p puede estar dada por: 








q+rKk? 
= —_— -1 
Al diferenciar a p respecto a K y al igualar el resultado a cero, se obtiene 
o - 2rK[1 — (g — HKY]— (q + rK*)l(g - hK)h] _ 0 
oK [i - @ ~ hKYF 
que da 
rK[1 — (g = hKY]- (q +rKYVMg — hK)ìh = 0 
De donde, se obtiene 
q + rK? e rK (8-130) 
1 (8 -AKY h(g — hK) 
De las ecuaciones (8-129) y (8-130), se obtiene 
ss 
P hR- hK) (8-131) 
Al resolver la ecuación (8-131) para K y observando que r + ph? > 0, se tiene 
h 
K = EP = ghp(r + ph?) (8-132) 


r + ph? 


que es la ecuación (8-126) 


Al sustituir la ecuación (8-132) en la ecuación (8-125), 
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22,2 2 
ghpr gr 
+ 2 + -p= 
q (r + ph?Y pl + o) P 0 
que se puede simplificar a 


q =p +grp(r + phy’ =0 
que es la ecuación (8-127). 
El mismo resultado se puede obtener en la forma siguiente. Primero observe que la ecuación (8-125) 
se puede modificar como sigue: 


q + (r + ph")K? — 2ghpK + pg?-p=0 


Y 
A ghp Y grp 
a+pe-p+|Vr+ EK - A) Z =0 (8-133) 
P P a ne r + ph 


Entonces, al considerar esta última ecuación como una función de K, el mínimo del lado izquierdo de esta 
ecuación con respecto a K ocurre cuando 


Vr + pK - UP 
V1 + ph? 


K = ghpír + ph?)" (8-134) 


que es la ecuación (8-126). 
Al sustituir la ecuación (8-134) en la ecuación (8-133). se obtiene 
g? kp 


+ pg?-p- = 
q + Pg Porok S 





que se puede simplificar como sigue: 
q =p +grp(r + phy'=0 
que es la ecuación (8-127). 
Problema A-8-6 
Considere el sistema definido por 
bo + Y E | -0.5 Ee A Al 
x(k +1) 0 1.5 || xk) 0 
Muestre que este sistema no puede ser estabilizado mediante el esquema de realimentación del estado: 
u(k) = —Kx(k) 
cualquiera que sea el valor de la matriz K. 
Solución Se define a 


K = [kı k2] 


Entonces 


0 1.5 0 1.5 


Por lo tanto, la ecuación característica se convierte en 
Or Orta WWW-Fres Iros.me 


cake a E K HG ka] = a -k -0.5- i 


620 Sistemas de control óptimo cuadrático Capitulo 8 


2+05+k, 0.5 +0.5k, 
0 z-1.5 


= (2 +0.5+k)G -15)=0 
Los polos de lazo cerrado están localizados en 


z=-—0.5-ki, z=1.5 


Izl — G + HK| = 


Ya que el polo en z = 1.5 está localizado fuera del círculo unitario, el sistema es inestable, cualquiera que sea 
el valor de la matriz K. Por lo tanto, la técnica de control óptimo cuadrático no se puede aplicar a este 
sistema. (La solución del problema del control óptimo cuadrático no existe.) 


Problema A-8-7 


Considere el sistema 


x(k + 1) a 0 0 1(k) 1 1 0 1 
E + n á [i JE) A [opo e] = fi) a 
y el indice de desempeño 


æ 


J= e [x*()Qx(k) + u*(k)Ru(k)] (8-136) 
donde 
eli] 


Determine la ley de control óptimo que minimiza el índice de desempeño. También determine el 
valor mínimo de J. 


Solución De la ecuación (8-135) se tiene 


_[p0 0 1 
La matriz P se puede determinar de la ecuación (8-101), o 


P = Q + G*P(1 + HR H*P)'G (8-137) 


Como las matrices Q, G, H y R son reales, la matriz P es una matriz real simétrica. Al sustituir las matrices 
dadas Q, G, H y R en la ecuación (8-137), se obtiene 


E 
Pu Pz [0 0 0 1||pu Pz 0 1 
1 u puly [0 0 
Hi oe a k y 


Al simplificar esta última ecuación, se obtiene 
Pu Pri 1 0 + 1 Py Pall “Pu TP 
PR Pa 0 0 1+ puļ| Pu Paelll+pu 1+pu 
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Pull + pu) pill + pu) -|1+pu 0 
Pull + pu) pa(l + pu) 0 0 


+ E + pall + pu) -pù + pal + pn) 
=P + pal + pu) -piz + pal + pn) 


Esta última ecuación es equivalente a las tres ecuaciones siguientes: 
Pull + pu) =1 + pn pi + pall + pu) 
Poll + pu) = -piz + pall + pu) 
Poll + pu) = -pih + pall + pu) 
Al resolver estas tres ecuaciones para py, P¡, y Pa Se requiere que p,, > 0, se obtiene 


Pu= 1, PR = 0, Pz = 0 


fio 
po! ol (8-138) 


La ecuación (8-138) da la solución requerida de la ecuación de Riccati en estado estacionario. 
Con referencia a la ecuación (8-79), se tiene 


De donde 


u(k) = —(R + H*PH)' H*PGx(k) 


-4+ 071 of I IG 


-2"'[0. OJx(k) = 0 (8-139) 


La ecuación (8-139) da la ley de control óptimo. 
El sistema en lazo cerrado se convierte en 
x(k + 1) = Gx(k) + Hu(k) = k thw (8-140) 


La ecuación (8-140) da la operación óptima en lazo cerrado del sistema. Los polos de lazo cerrado están en 
pu = l y m, = 0. El sistema en lazo cerrado no es asintóticamente estable. 
El valor mínimo de J se obtiene de la ecuación (8-81), como sigue: 


eta -1 1 0[p1/_1 
Jain = 3x*(0)Px(0) = 5 [1 E IB = 


2 
Aunque el sistema no es asintóticamente estable, el índice de desempeño es finito y mínimo. De hecho, ya 
que u(k) = 0 para k = 0, 1,2,..., la ecuación del sistema se convierte en 
x(k+1)=0 


x(k + 1) = x(k) + x(k) 
x(0=1,  x(k)=0, k=1,2,3,... 


x(0)=1, x(k)=2, k=1,2,3,... 


Observe que el índice de desempeño es finito, porque involucra en x,(k), pero no involucra a x(k). 
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Este problema de ejemplo ha mostrado que en un caso académico pero no práctico, el control 
óptimo cuadrático no produce un sistema asintóticamente estable. 


Problema A-8-8 


Si un sistema de control de tiempo discreto lineal de orden n de una entrada y una salida es de estado 
completamente controlable, se necesita al menos n periodos de muestreo para llevarlo desde un estado ini- 
cial arbitrario a un estado final deseado, considerando que el vector de control no está limitado. Por lo tanto, 
si se permite que N (N > n) periodos de muestreo, entonces se tendrá libertad adicional para satisfacer 
especificaciones adicionales. 

La cantidad de energía de control que se necesita depende del intervalo de tiempo (número de 
periodos de muestreo) permitido para control. Si el número de periodos de muestreo permitido es n, el 
“orden del sistema, entonces la secuencia de control de tiempo óptimo u(0), 4(1),..., u(n— 1) es única. Sin 
embargo, si se permiten N periodos de muestreo (N > n), entonces es posible más de una secuencia de 
control. Cada secuencia de control posible requiere una cierta cantidad de energía de control. En muchas 
aplicaciones industriales, si son posibles muchas secuencias de control, es preferible lograr las tareas de 
control empleando la cantidad mínima de energía. 

En este problema, se trata de transferir el estado desde un estado inicial arbitrario al estado final 
deseado (que se supone es el origen del espacio de estado) en N periodos de muestreo y al mismo tiempo 
usar la mínima cantidad de energía de control. 

Considere el sistema de control definido por 


x(k + 1) = Gx(k) + Hu(k) (8-141) 
donde 
x(k) = vector de estado (vector-1) en el instante de muestreo k 
u(k) = señal de control (escalar) en el instante de muestreo k 
G = matriz no singular de n x n 
H = matriz den x 1 


Determine la ley de control que llevará al estado del sistema desde un estado inicial arbitrario al 
origen en N periodos de muestreo (donde N> n) al usar la mínima cantidad de energía, donde la energía de 
control se mide con 


1 N-1 
5 È Uk) 
2 k=0 
Suponga que el sistema es de estado completamente controlable. 


Solución Con referencia a la ecuación (5-30), el estado x(N) de la ecuación (8-141) se puede escribir 
como 


x(N) = G"x(0) + G"*Hu(0) + G? Hu(1) + -+ + GHu(N — 2) + Hu(N — 1) 
Al sustituir 0 por x(N) en esta última ecuación 
x(0) = -G*Hu(0) - G?Hu(1) — --: — G~" Hu(N - 2) - G"Hu(N - 1) (8-142) 


Se define 
fi = G”H (8-143) 
Entonces la ecuación (8-142) se convierte en 
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x(0) = —f£,4(0) — f2u(1) — +++ — fy-¡u(N — 2) — fyu(N — 1) (8-144) 


Ya que el estado es completamente controlable, los vectores f}, f}, . . . , f, son linealmente independientes. 
(Los N — n vectores restantes se pueden expresar como una combinación lineal de estos n vectores 
linealmente independientes.) La ecuación (8-144) se puede reescribir como 


x(0) = -FU (8-145) 
donde 
u(0) 
F=[fiibi ifa], U uc 
u(N - 1) 


Ahora se encontrará la secuencia de control que satisface la ecuación (8-145) y al mismo tiempo minimiza 
la energía de control total. Observe que la matriz F es de n x N y tiene rango n. Ya que F no es una matriz 
cuadrada, la inversa de F no está definida. Observe que como N > n el número de señales de control 
desconocidas u(0), u(1),..., u(N— 1) en la ecuación (8-145) es mayor que el número n de ecuaciones 
escalares. Un conjunto de ecuaciones escalares en esta situación se dice que es indeterminado y posee un 
número indefinido de soluciones. Sin embargo, en este caso se tiene una limitante que hace que un conjunto 


de N variables desconocidas (0), u(1), .. ., uN — 1) produzcan una norma mínima: 
1 N-1 
3 Y uk) = minimum 
k=0 


Entonces, como se observa en el apéndice A (Sección A-8), existe una solución única. Dicha solución da la 
secuencia de control que lleva a un estado inicial arbitrario x(0) al origen en N periodos de muestreo y al 
hacer esto minimiza la energía de control total. 

La solución minimizante en dicho problema, donde el número de variables desconocidas es mayor 
que el número de ecuaciones, se puede obtener en términos de la pseudoinversa derecha (refiérase al 
apéndice A). La pseudoinversa derecha se define como sigue: 


F™ = F*(FF*)7! (8-146) 


Al emplear la pseudoinversa derecha, la secuencia de control de energía mínima u(0), (1), ...,u(N—1) que 
transfiere a un estado inicial arbitrario x(0) al origen está dada por 


U = —-F™ x(0) = —F*(FF*)”" x(0) (8-147) 
Observe que F*(FF*)” es una matriz de N x n. De donde, F*(FF*y' posmultiplicada por x(0) es una 
matriz de N x 1. La ecuación (8-147) se puede rescribir como: 
u(0) 
u(D | FER") x(0) (8-148) 
u(N - 1) 


La secuencia de control dada por la ecuación (8-148) llevará a un estado inicial arbitrario al origen en N 
periodos de muestreo y requerirá la mínima cantidad de energía entre todas las secuencias de control 
posibles que requieren N periodos de muestreo. 
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Problema A-8-9 
Considere el sistema 


x(k + 1) = Gx(k) + Hu(k) (8-149: 


G= 1 0.6321 H= 0.3679 x(0_ | 5 

0 0.3679 | 0.6321 | xl(0)) |-S 
Se desea llevar al estado inicial al origen en tres periodos de muestreo. (El periodo de muestreo se supone 
de ] segundo.) Entre la infinidad de posibles opciones para la secuencia de control, determine la secuencia 


de control óptimo que minimizará la energía de control, o la que minimizará el siguiente índice de desem- 
peño. 


donde 


Í 2 
J=2) uk) 
2 ezo 
Solución De la ecuación (8-144), el estado inicial x(0) se puede escribir como sigue: 


x(0) = -f1 u(0) — fzu(1) — fsu(2) 


donde 
_ 1 _[-0.7181 an _ [ -3.6701 su [ =11.6939 
f=G H | e =G n=| A =G H=] 126939 
De donde, 
x0] _ _[-o0.781} .. [P-3.6701] .. [-11.6939 
Ea | duo | O.) l P O 
10) 
x:(0)]_ _[-0.7181 -3.6701 —11.6939 A 
x2(0) 1.7181 4.6701 12.6939 a (8-150) 


Mediante el uso de la pseudoinversa derecha, se puede obtener la solución de la norma mínima de la 
ecuación (8-150) como 


u(0) 
u(1) | = -F®™ x(0) = -rera 2O] 
donde ua Í 


F= —0.7181 -—3.6701 -—11.6939 
1.7181 4.6701 12.6939 


La pseudoinversa derecha F*™ se determina como sigue: 


FRY = F*(FF*)7 


-3.6701 4.6701 
-11.6939 12.6939 


0.7910 0.7191 
0.5000 0.4738 
0.2910  —0.1929 


-0.7181 asmo: | 150.7326 nin 


-166.8147 185.8968 


de donde, 
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u(0) 0.7910 0.7191 Fr . 0.3598 
u(1) | = -| 0.5000 0.4738 E = | —0.1310 (8-151) 
u(2) —0.2910 —0.1929 0.4908 


La secuencia de control dada por la ecuación (8-151) llevará al estado inicial al origen en tres periodos de 
muestreo y también minimiza la energía de control total. 

Al emplear la secuencia de control óptimo dado por la ecuación (8-151), el estado se puede 
transferir como: 


(1) |_|1 0.6321 | 5 0.3679 |. _| 17071 
ESE | E 0358 = | 3007 | 
x1(2)| _|1 0.6321] 1.7071 0.3679 |. _| 0.3524 
El A E lc] j al e ES E 
x1(3)| _ |1 0.6321 || 0.3524| _ | 0.3679 _ l0 
Eo z E pc [e i [038 4508 A H 

La mínima cantidad de energía para este control es 


Jain = PUG = TAO + u?(1) +u(2)] = 5 [(0.3598y + (-0.1310)? + (0.4908)?] 


= 0,1937 


Es interesante comparar la energía mínima obtenida aquí con la energía requerida para el sistema de 
control de tiempo óptimo. El sistema de control de tiempo óptimo requiere 2 periodos de muestreo. En el 
problema A-6-2, la secuencia de control de tiempo óptimo u(0) y u(1), donde el periodo de muestreo era 
de 1 segundo, se encontró como 


u(0) = —-1.5820x,(0) — 1.2433x(0) 
u(1) = 0.5820x,(0) + 0.2433x(0) 


[Refiérase a la ecuación (6-231).] Al tomar x,(0) = 5 y x,(0) =-S y al sustituir estos valores en estas dos 
ecuaciones, se obtiene u(0) = -1.6935 y u(1) = 1.6935. Por lo tanto. para el control de tiempo mínimo la 
energía total requerida es 


ZiO) + (1) = 5[CL6935) + (1.6935)"] = 2.8679 


Observe que al permitir que la duración del control sea de tres periodos de muestreo (3 segundos). en lugar 
de dos periodos de muestreo, la energía requerida se puede reducir notablemente. 


Problema A-8-10 


Considere el sistema de péndulo invertido mostrado en la figura 8-10, donde un péndulo invertido está 
montado sobre un carro impulsado por un motor. En este caso se considera sólo el problema en dos 
dimensiones en que el péndulo se mueve únicamente en el plano del papel. El péndulo invertido es 
inestable ya que puede caer en cualquier momento a menos de que se aplique una fuerza de control 
adecuada. Suponga que la masa del péndulo está concentrada en el extremo de la varilla como se muestra en 
la figura. (Se supone que la varilla no tiene masa.) La fuerza de control u se aplica al carro. 

En el diagrama. 0 es el ángulo de la varilla respecto a la línea vertical. Se supone que 8 es pequeño por 
lo que el sen 8 y el cos 8 se puede aproximar a O y a 1 respectivamente, y también se supone ĝ que 
es pequeño por lo que 96? =. (Bajo estas condiciones. las ecuaciones del sistema no lineal se pueden 
linealizar.) 
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Figura 8-10 Sistema de péndulo invertido. 





o 
7 
j 
Z 
7 
A 
h 
A 
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Se desea mantener el péndulo en la posición vertical en respuesta a cambios escalón en la posición 
del carro. (La fuerza de control u se aplica al carro.) Primero obtenga el modelo en el espacio de estado en 
tiempo continuo. Después discretice dicho modelo y obtenga el modelo discreto. Suponga que el periodo 
de muestreo T es de 0.1 segundos. Suponga los siguientes valores numéricos para M, m y |: 


M =2 kg, m = 0.1 kg, 1=05m 
(En la sección 8-4 se diseñó un controlador digital para el sistema de péndulo invertido.) 


Solución Se define el ángulo de la varilla desde la línea vertical como 6. (Como se desea mantener al 
péndulo invertido en posición vertical, se supone que 0 es pequeño.) También se definen las coordenadas 
(x, z) del centro del gravedad de la masa como (x¿;, Zo). Entonces 


xg =x + iseng 
zc = l cos0 


Al aplicar la segunda ley de Newton en la dirección x del movimiento se obtiene 





d? x d’ xo 
Mp +m ar u 
o 
d’x d? < 
Mpt "gre + I send) = u (8-152) 


Observe que 
a sen = (cos 0)6 
dt 


2 


a seng = —(sen0)ĝ? + (cos 0)ë 


E cos 8 = —(seng)6 


2 


qe só = — (cos 0)0? — (sen 6)ë 
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La ecuación (8-152) se puede escribir como 
(M + m)š — ml(seng)0* + mi(cos 0)ð = u (8-153) 


La ecuación del movimiento de la masa / en la dirección z no se puede escribir sin considerar el 
movimiento de la masa m en la dirección v. Por lo que. en lugar de considerar el movimiento de la masa 77 
en la dirección z. se considera el movimiento rotacional de la masa m alrededor del punto P. AÍ aplicar la 
segunda ley de Newton al movimiento rotacional. se obtiene 

2 2 


d 22 cos0 — E ze 
qe. dr 





m i senĝð = mgl send 


Y 


X 


8 2 
[mo + | sen o) cos 6 — [má cos J seng = mgl send 


que se puede simplificar como sigue: 


m[x — HKsen0)6? + I(cos 9)0]! cos 6 — m[—l(cos 0)6 ° — lsen6)8]/ sin 0 = mgl sen8 


Una simplificación posterior resulta en 
mx cos O + ml = mg send (8-154) 


Al sustituir el sen 9 + 6, cos 8 1. y 967 + 0, las ecuaciones (8-153) y (8-154) se pueden linealizar como 
sigue: 


(M + m) + mló = u (8-155) 
mx + mið = mg0 (8-156) 
Estas ecuaciones linealizadas son válidas mientras 0 y O sean pequeñas. Las ecuaciones (8-155) y (8-156) 


definen un modelo matemático del sistema del péndulo invertido. 
Las ecuaciones del sistema linealizado. ecuaciones (8-155) y (8-156). se puede modificar a 


MIÖ = (M + m)gð — u (8-157) 
Mx = u — mgó (8-158) 


La ecuación (8-157) se obtuvo al eliminar Y de las ecuaciones (8-155) y (8-156). La ecuación (8-158) se 
obtuvo al eliminar 9 de las ecuaciones (8-155) y (8-156). Las variables de estado x,. xs. Ya y xy se definen 


como 
X = le) 
x=0 
XA 
Xa=X 


Observe que el ángulo 0 indica la rotación de la varilla del péndulo alrededor del punto P. y x es la ubicación 
del carro. Se considera a x como la salida del sistema. o 


Y=ZX=X 
Entonces. de la definición de las variables de estado y de las ecuaciones (8-157) y (8-158). se obtiene 
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X= X 
a M+m > 1 
25 M ® yl" 
X3 = X4 
Xx am Ey 
= -M NY 
En términos de las ecuaciones vector-matriz, se tiene 
0 1 0 0 0 
¿ + 
Fa A A E 
ž2| _ MI || M 8-159 
la o 00 dlx o |“ ($5133) 
Xa _ m X4 1 
mé 0.00 M 
Xi 
y=[0 0 1 Q|” (8-160) 
X3 
Xa 


Las ecuaciones (8-159) y (8-160) dan una representación en el espacio de estado del sistema de péndulo 
invertido. (Observe que la representación en el espacio de estado no es única. Existen una infinidad de esas 
representaciones.) 

Al sustituir los valores numéricos de M, n y l, se obtiene 


M+m 
MI 


= LLIA Aa di 
g = 20.601, gE T ga ga 





Entonces la ecuación de estado y de salida para el péndulo invertido con carro se convierte en: 


x = Ax + Bu (8-161) 
y = Cx + Du (8-162) 
donde 
0 100 0 
20.601 0 0 0 1 a E 
A= 0 oo 1b B= ob C=[0 0 1 0, D=0 
0.4905 0 0 0 0.5 


Ahora, se discretiza la ecuación de estado, ecuación (8-161). La discretización se logra al emplear el 
siguiente comando de MATLAB: 


[G,H] = c2d(A,B,T) 


donde T es el periodo de muestreo involucrado en el sistema de control de tiempo discreto. En este 
problema T = 0.1 segundos. Entonces el comando 


[G,H] = c2d(A,B,0.1) 


transformará la ecuación de estado en tiempo continuo en la ecuación de estado en tiempo discreto. 
Observe el siguiente comando y salida de MATLAB. 
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[G,H] = c2d(A,B,0.1) 


G= 


1.1048 0.1035 0 0 
2.1316 1.1048 0 0 
0.0025 —0.0001 1.0000 0.1000 
0.0508 —0.0025 O 1.0000 





Por lo tanto, el modelo discretizado en el espacio de estado está dado como sigue: 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) + Du(k) 
donde 


1.1048 0.1035 0 0 0.0051 
G=| 21316 1.1048 0 0 g = | 701035 
—0.0025 —0.0001 1 0.1? | 0.0025 
—0.0508 —0.0025 0 1 0.0501 
C=[0 0 1 0, D= 
PROBLEMAS 


Problema B-8-1 


Considere el sistema discreto 


x(k + 1) = Gx(k) + Hu(k) 


eos AL A-|!) =f] 


Determine la secuencia de control óptimo u(k) que minimiza el índice de desempeño siguiente: 


donde 
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J = ZA (8)SK(8) + 3 D DEOK) + UOR] 


donde 


Problema B-8-2 
Considere el sistema 


x(k + 1) = Gx(k) + Hu(k) 


cafes -ih -E 


= J=} Y [x*(K)Qx(k) + u*(k)Ru(k)] 


k=0 


donde 
y el índice de desempeño 


donde 


-|1 0 z 
e=; = a 


Determine la ley de control óptimo que minimiza el indice de desempeño. También determine el valor 
mínimo de J. 


Problema B-8-3 
Considere el sistema definido por 
x(k +1)|_]1 1 x(k) x(0)|_ [1 
x(k + 1) a ~i xk)" x2(0) 1 


donde —1 < a < 0. Determine el valor de a tal que el índice de desempeño 


J = 5 È *0)0x0) 


donde 


Q 
Il 
pey 


1 0 
0 0.5 


se minimice. 
Problema B-8-4 
Un sistema de control discreto está definido por la ecuación 


x(k + 1) = 0.3679x(k) + 0.6321u(k) 


Determine la ley de control óptimo que minimice el siguiente índice de desempeño: 


ES 


J =5 È P +0) 


También determine el valor mínimo del indice de desempeño J. 
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Problema B-8-5 
Considere el mismo sistema tratado en el problema A-8-6. ¿Es posible determinar una matriz definida 
positiva P para este sistema? Utilice la ecuación (8-101) para determinar la matriz P. 

Problema B-8-6 


Considere el sistema definido por las ecuaciones 


x(k + 1) = Gx(k) + Hu(k) 
y(k) = Cx(k) 
donde x(4) es un vector n, (k) es un vector r. y(k) es un vector-m, G es una matriz de n x n, H es una 


matriz de n x r, y C es una matriz de m x n. El índice de desempeño es 


j= 2 [x*(k)Qx(k) + u*(k)Ru(k)] 


donde Q es una matriz Hermítica definida positiva de n x n y R es una matriz Hermítica definida positiva 
de r x r. La ley de control óptimo que minimiza al índice de desempeño está dada como u(4) = —Kx(£). 
Muestre que si el sistema es de estado completamente controlable y observable entonces la ecuación 
algebraica de Riccati 
P = Q + GPG* — GPC*(R + CPC*)' CPG* 


tiene una solución definida positiva única. Muestre también que el sistema en lazo cerrado óptimo es 
estable, o G — HK es una matriz estable. 


Problema B-8-7 


Con referencia al problema A-8-9, resuelva el mismo problema con MATLAB. Determine la secuencia de 
control óptimo (0), (1) y u(2). 


Problema B-8-8 
Considere el sistema 
x(k+10j_11 1] x(k) 1 xi1(0)]) ¡1 
E + R] = : y re) : [i po 50] j B 


Se desea llevar el estado inicial al origen en n periodos de muestreo. Determine la ley de control óptima que 
minimiza la energía de contro! medida con 


J= 


Nise 


È uk) 

k=0 
Considere los valores den:n=2,n=3yn=4. 

Problema B-8-9 


Considere el diseño del sistema de seguimiento mostrado en la figura 8-11. La planta no involucra un 
integrador, por lo que se incluye un controlador integral en el lazo. El periodo de muestreo T es de 0.1 
segundos. 

Muestre que el sistema de ecuaciones se puede dar mediante las siguientes ecuaciones en el espacio 
de estado: 


x(k + 1) = Gx(k) + Hw(k) 
w(k) = —Kx(k) 
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yik) 





Figura 8-11 Sistema de seguimiento. 


donde 


oH OO], w(K) = u(k) — u(=) 
foso f2 E 
c= o J a-[3) K=[k —k] 


Con referencia al problema B-8-9, se desea diseñar la matriz de ganancia de realimentación del estado K = 
[k —k,] tal que el sistema tenga una respuesta al escalón razonable. Se supone que se emplea el esquema 
de control óptimo cuadrático. 

Se supone el índice de desempeño siguiente: 


Problema B-8-10 


J =$ È (09000 + wR] 


Si Q y R se escogen como definidas positivas, el sistema resultante es estable. Para este problema, se 


escogen 
_fao0 0 X 
e-[* | R=1 


Observe que Q y R son sólo un conjunto posible. (Se pueden seleccionar otras Q y R definidas positivas. 
El sistema resultante es estable pero diferente para cada conjunto distinto de Q y R.) 

Empleando la representación en el espacio de estado del problema B-8-9, determine la matriz K con 
MATLAB. Escriba un programa en MATLAB. Al utilizar la matriz K así determinada, obtenga la 
respuesta al escalón del sistema diseñado con ayuda de MATLAB. Dibuje la gráfica de y(k) contra k y v(k) 
contra K, 
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Análisis vector-matrices 


A-1 DEFINICIONES 


Las matrices que se encuentran con frecuencia en el estudio de la teoría de control moderna son la 
matriz simétrica, la matriz anti-simétrica, la matriz ortogonal, la matriz Hermítica, la matriz anti- 
Hermítica, la matriz unitaria y la matriz normal. Las siguientes ecuaciones definen estas matrices: 


A T=A A es simétrica 

A” =-A A es anti-simétrica 
AA” =A'A=I A es ortogonal 

A* = A es Hermítica 

A* =-A A es anti-Hermítica 
AA* = A*A =l A es unitaria 
AA* = A*A o AA” = A'A A es normal 


donde el superíndice * denota la transpuesta conjugada y el superíndice T significa la transpuesta. 


A-2 DETERMINANTES 


Determinantes de una matriz de 2 x 2,3x 3 y4Xx4. Para una matriz A de 2 x 2, se tiene 


a a, 


b, b, = q b: a bia 


lA] = 
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Para una matriz A de 3 x 3, 


Análisis 


vector-matriz Apéndice A 




















41 4 4; 
lA] = b; b» b; = a1b>c3 + b,c,a3 + c1azb3 — c;b,az — biac — a b3 C 
CG O G 
Para una matriz A de 4 x 4. 
a; 4 43 l4 ; 
aj- hi ba bs bs 
C O C3 Cs 
dı d, d; d; 
_ la a| |c; Ci o a a! |b; baj 
ib; b-i id; d;l C; da] d; dul 
+ |a a |b; ba ES b, b, a3 d4 
id; də! IC3 Cy Gi +03 d; d, 
| ; 
bi balas a c; clas a 
— | 1 O (E Aaj E E aj (Al 
d; d! 1C3 Cy di dz b; bal 











(Esta expansión se llama expansión de Laplace por menores.) 


Propiedades del determinante. El determinante de una matriz de n x n tiene las siguientes 


propiedades: 


1. 


Si dos renglones (o dos columnas) del determinante se intercambian, sólo el signo del determi- 


nante se cambia. 

El determinante es invariante bajo la suma de un escalar múltiplo de un renglón (o una colum- 
na) a otro renglón (o columna) 

Si una matriz de n x n tiene dos renglones (o columnas) idénticos, entonces el determinante es 


cero. 
Para una matriz A de n x n, 


¡A'] = lal, — [4*| = [Al 


El determinante de un producto de dos matrices A y B de n x n es el producto de sus determi- 
nantes 


|AB| = |A| |B| = [BA] 
Si un renglón (o una columna) se multiplica por un escalar k, entonces el determinante se 
multiplica por k. 
Si todos los elementos de una matriz de n x n se multiplican por k, entonces el determinante se 
multiplica por k”, es decir, 
IA] = K"]A] 
Si lo valores propios de A son à, (¿= 1,2,..., 7), entonces 
A] = Ai àz... An 


De donde, |A| + 0 implica que A, + 0 para ¿= 1,2, .. . , n. (Para detalles de los valores propios. 
vea la sección A-6.) 
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9. Si las matrices A, B, C y D son de n x n, de n x m, de m x n y de m x m, respectivamente, 


kad 








entonces 
O p-e p-m. sija+oym+o (A2) 
i B-le D| =0. si |A| = 0 o |D|=0 o |A| = |D|=0 
También, 
A B| _flA[[D-CA“B|,  sila +0 (A-3) 
c DO DÍA - BDC), si[D|+0 (A-4) 


[Para obtener la ecuación (A-2), vea el problema A-1. Para obtener las ecuaciones (A-3) y (A-4). 
refiérase al problema A-2.] 
10. Para una matriz A de n x m y una matriz B de m x n. se tiene. 


IL, + AB] = |In + BA| (A-5) 


(Para la prueba, vea el problema A-3.) En particular, para 1 = 1, es decir, para una matriz A de 
n x | y una matriz B de 1 x n, se tiene, 


|I, + AB] = 1 + BA (A-6) 


Las ecuaciones (A-2) hasta la (A-6) son útiles en el cálculo de los determinantes de matrices 
de orden grande. 


A-3 INVERSIÓN DE MATRICES 


Matriz no singular y matriz singular. Una matriz cuadrada A es una matriz no singular si 
existe una matriz B tal que BA = AB = I. Si dicha matriz B existe, entonces se denota como A”. 
A"! se llama la inversa de A. La matriz inversa A”! existe si A] no es cero. Si A”! no existe. A se dice 
ser singular. 

Si A y B son dos matrices no singulares, entonces el producto AB es una matriz no singular. 


(AB) ' = B'A! 
Asimismo, 
(AT)! En (A7') 
y 
(4%) = (471)* 
Propiedades de la inversa de una matriz La inversa de una matriz tiene las siguientes pro- 
piedades. 
l. Sik es un escalar no cero y A es una matriz de n x n no singular, entonces 
1 
kA)! =- A~ 
(KA)! => 
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El determinante de A” es el inverso del determinante de A, o 


A= pa 


Esto se puede verificar fácilmente como sigue: 
JAA”!] = JA] |A] = 1 


Fórmulas útiles para encontrar la inversa de una matriz 


. Para una matriz A de 2 x 2, donde 


afi A ad — be + 0 
c d 


la matriz inversa está dada por 


x 1 d -b 
l= 
A a al 


. Para una matriz A de 3 x 3, donde 


a b c 
A=|jd e fl, lA] +0 
g hi 
la matriz inversa está dada por 
Ple f| lb c b sal 
h i h i e f 
A`! at d f a e ja c 
lA] [lg i g i d f 
d el ja b a b 
| g h g h d el|| 


























. Si A, B, C y D son, respectivamente, matrices de n x n, de n x m, de m x ny de m x m, entonces 


(A + BDC) = A~! — A` B(D! + CAB) CA~! (A-7) 


con la condición de que las inversas indicadas existan. La ecuación (A-7) se refiere común- 
mente como el lema de inversión de matrices. (Para la prueba, vea el problema A-4.) 
Si D = 1,, entonces la ecuación (A-7) se simplifica a 


(A + BC) = A~! — A“ B(L, + CA B)’ CA’ 
En esta última ecuación, si B y C son matrices de nx 1 y de 1 x n, respectivamente, entonces, 


ABCA” 
A + BC)! =A71- HS - 
E 1+ CAB SENO 


La ecuación (A-8) es útil en que si una matriz X de n x n se puede escribir como A + BC, 
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donde A es una matriz de n x n cuya inversa es conocida y BC es el producto de un vector 
columna y un vector renglón, entonces X”' se puede obtener fácilmente en términos de las 
matrices conocidas A”, B y C. 
4. Si A, B,C y D son, respectivamente, matrices de 2 x n, de nx m, de m x ny de m x m, entonces 
A B|" _[A" + A~`B(D - CAB) CA“! -A“B(D- CAB)" 
C D -(D — CAB) *CA”! (D — CAB)” 
(A-9) 
con la condición de que |A| # 0 y |D —- CA” B| # 0, o bien 
A BJ'_ (A — BDC)” —(A — BDC) BD“! 
C D|  |-D"C(A-BD"'C)! D"C(A — BDC) BD” + D~ 
(A-10) 
con la condición de que |D] P 0 y [A — BD”' C} P 0. En particular, si C = 0 o B = 0, entonces las ecuaciones 
(A-9) y (A-10) se pueden simplificar como sigue: 


=f 
A B A~ -A`'BD” 
jo ol [o Aa] a-n 
o 
-1 
A 0 A`! 0 
E Sa ña] dae 


[Para obtener las ecuaciones (A-9) hasta (A-12), refiérase a los problemas A-5 y A-6.] 


A-4 REGLAS DE OPERACIONES CON MATRICES 


En esta sección se revisarán algunas reglas de operaciones algebraicas con matrices y después se 
dará la definición de la derivada e integral de una matriz. Luego se presentarán las reglas de diferen- 
ciación de matrices. 

Observe que el álgebra de matrices difiere del álgebra de números ordinarios en que la multi- 
plicación de matrices no es conmutativa y la cancelación de matrices no es válida. 


Multiplicación por un escalar. El producto de una matriz y de un escalar es una matriz en la 
cual cada elemento está multiplicado por el escalar. Es decir, 


ka; ka, € kaim 
kA = kazı kan ne kazn 
kanı kam AS KG nm 


Multiplicación de una matriz por una matriz La multiplicación de una matriz por una 
matriz es posible entre matrices cuyo número de columnas en la primera matriz es igual al número de 
renglones en la segunda. De otra forma, la multiplicación no está definida. 

Considere el producto de una matriz A de n x m y una matriz B de m x r: 
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da an to millón be c by 
AB =|% 2 0 Gnlón ba": bs 
an Am *** Gmllóm Bm *** Dm 

Cu Cr tt? Ci 

— C21 Ca pa Ca 

Cri Cm *** Car 


donde 


m 
Cik = D Aij bik 
j=1 


Por lo tanto, la multiplicación de una matriz de n x m por una de m x r da una matriz de n x r. Se debe 
notar que, en general, la multiplicación de matrices no es conmutativa; es decir, 


AB + BA en general 


Por ejemplo 
AB = ba a e 2 a + aby anbu + ab, 
da anj| ba bz anbi + anba abi + anbn 
y 
BA = le e a m ea + ban buan + bnan 
ba ball an az bnan + bay bnan + bnan 


Así, en general AB + BA. De donde, el orden de la multiplicación es significativo y se debe preser- 
var. Si AB = BA, las matrices A y B se dicen que conmutan. En las matrices A y B anteriores, si, por 
ejemplo, a = a,, = b,,= ba, = 0, entonces A y B conmutan. 
Para matrices diagonales A y B de n x n, 
anbi 0 
AB = [a;; &; [b &;] = iai ; 
0 Annbnn 


Si A, B y C son matrices de n x m, de m x r y de r x p, respectivamente, entonces la ley 
asociativa siguiente se cumple: 


(AB)C = A(BC) 


Esto se puede probar como sigue: 


m 


el elemento (i, k) de AB = 2 a, by 


el elemento (j, h) de BC = > Dik Cin 
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el elemento (i, +) de (AB)C = y (Sas, ) M > 3 (a, DCi 
a da 5 abia Cin) = 2 ay Y Br cu 
j=1k=1 j=1 k=1 


lemento (i, h) de A(BC) 
Como la asociatividad de la multiplicación de matrices se conserva, se tiene 
ABCD = (ABY(CD) = A(BCD) = (ABC)D 
AMES ARA”. m,n = 1,2,3,... 


Si A y B son matrices de n x m y C y D son matrices de m x r, entonces la siguiente ley 
distributiva se cumple: 


(A + BIC + D) = AC + AD + BC + BD 


Esto se puede probar al comparar el elemento (i, j) de (A + B) (C + D) con el elemento (i, j) de 
(AC + AD + BC + BD). 


Comentarios sobre la cancelación de matrices. La cancelación de matrices no es válida en 
el álgebra de matrices. Considere el producto de dos matrices singulares A y B. Tome por ejemplo, 


i21 fı -2 
a-i? ¿40 s- A 


o- -R -o 


Es evidente que AB = 0 implica que A = 0 o que B = 0. De hecho, AB = 0 implica una de las 
siguientes tres: 


Entonces 


A= 
B 


SI 


0 
=0 
A y B son similares. 

Se puede ver fácilmente que, si A y B son matrices no cero y AB = 0, entonces A y B deben ser 
singulares. Suponga que B no es cero y A es no singular. Entonces |A| + 0 y A” existen. Entonces se 
obtiene 


A AB=B=0 


que contradice la suposición de que B no es cero. En esta forma se puede probar que A y B deben ser 


singulares si A+ 0y B % 0. 
De forma similar, observe que si A es singular entonces tampoco AB = AC ni BA = CA 
implican que B = C. Sin embargo, si A es una matriz no singular, entonces AB = AC implica que 


B =C y BA = CA implica que B =C. 
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Derivada e integral de una matriz. La derivada de una matriz A(f) de n x m se define como 
la matriz cuyos elementos (i, j) son las derivadas de las elementos (j, j) de la matriz original, si se 
considera que todos los elementos a,(t) tiene derivadas con respecto a £: 


d 
p O) gar ® 
—A(t) = : : 
dt d 
gO A ger 
En el caso de un vector de x(/) de dimensión n, 
d 
gO 
d 
—x(t) = : 
dt 
L ei) 
dt” 


De forma similar, la integral de una matriz A(t) de n x m con respecto a t se define como la 
matriz cuyos elementos (i, j} son las integrales de los elementos (, J) de la matriz original, o 


Pana e [amt dt 
A(t)dt = : 
anlt) di --- Í anm(t) dt 


al considerar que los elementos a,(f) son integrables como funciones de t. 


Diferenciación de una matriz. Si los elementos de las matrices A y B son funciones de f, 
entonces 


E (A +B)= Ca+<B (A-13) 
£ (AB) = = “A y + ai (A-14) 
Si K(£) es un escalar y es función de f, entonces 
dk(t) 
+ - 
P7 d TAk] = Ao) AG (A-15) 
También, 
b 
Í A kd = AB -f aTa (A-16) 
Es importante notar que la derivada de A”' está dada por 
d +1 = DA =1 
gA 7 -A di A (A-17) 
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La ecuación (A-17) se puede derivar fácilmente al diferenciar AA” con respecto a t. Ya que 


Lupi 4A da” 
PT jii a EAN 
y también 
dei Aa 
gor E a 
se obtiene 
dA! dA, 
u n 
o 
dA!  dA” dA 
1 at ai E E -1 
Ara dt t A Tii 


que es el resultado deseado. 


Derivadas de una función escalar con respecto a un vector. Si Xx) es una función escalar 
de un vector x, entonces 























ol J J A 
aJ gx; 8J 7x; AXi Ox, OX ÓXa 
ME s > SAED, => > : x 
ôx | a 2i PI ËS PJ 

óXa Ox. ÓX, 0X,.0X> dx? 


Asimismo, para una función escalar V(x(£)), se tiene 


T 
dato) z [2 dx 
dt óx) dt 
Jacobiano. Si una matriz f(x) de m x 1 es un vector función de un vector-n x (nota: un 
vector-n es un vector de dimensión nr), entonces 


dfi dfa E 
əx; ðX ðX, 
Ala af A 
— = ma AA ... po E A-18 
ðX 0x2 ðX ðX ( ) 
Bi Un 
OX. Xn OXn 


Dicha matriz de n x m se llama Jacobiano. 
Observe que, al utilizar esta definición de Jacobiano, se tiene 


Ax = AT (A-19) 
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El hecho de que la ecuación (A-19) se cumple, puede verse fácilmente del siguiente ejemplo: Si As 
x están dados por 


a a a i 

A 12 13 

E > X X2 
da An da 








X3 
entonces 
Xx; 
Aaxy= A a fi 
Ia Un da y5 09 X + AnX + a3 X3 f 
y 
hi h 
OXy Xi 3 
an 21 
ð 2 
— Ax = A of = ar an = A” 
OX 0X2 Xa i a 
13 az 
fi of. 
i 2 
0X3 Ox; 


Así, se tiene la siguiente fórmula útil. Para una matriz real A de + + s5 


ð e 
—x Ax = Ax Ax 


0X 


Además, si A es una matriz real simétrica, entonces 


1 x Ax = 2Ax 
ðX 


Observe que si A es una matriz Hermítica de 7 x n y x es un vector-n complejo eniczzes 


ð 
==xX*Ax = Ax 
AX 
[Para obtener las ecuaciones (A-20) y (A-21), véase el problema A-7.] 
Para una matriz real de n x m, un vector-n real x, y un vector-m real y, se tiene 


ð T 

2 zZ Al. 
ax * Ay = Ay ( 

ð T pls T 

y Ay =A'x (A-23) 


De forma similar. para una matriz compleja A de n x m, un vector-2 complejo x y un vector-1 
complejo y, se tiene 


ð 
-=x*Ay = A-24 
Gx Ay = Ay ( ) 
ð AS 

y Y = A X (A-25) 
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El hecho de que la ecuación (A-19) se cumple, puede verse fácilmente del siguiente ejemplo: Si A > 
x están dados por 


a ap a Xi 
1 12 3 

A = l A X= ¡X 
a2) da dx 

X3 


entonces 


a a a l aX X AX j 
a 
A 11 12 13 Xa 1141 1242 343| — 1 


da An a} Ay X, t 09X + d3X f 


E 


f de 
ox; Ox; a 
d ofi öfa 14} 21 
— Ax = | — =|= 2 rA r 
ðX Ox, 0X, e A 
ofi óf 13 Ga 
ðX, 8X3 


Así, se tiene la siguiente fórmula útil. Para una matriz real A de n x n y un vector-n real x, 


Ex TAx = Ax + Ax (A-20) 


Además, si A es una matriz real simétrica, entonces 


TAR = 2Ax 
ÒX 


Observe que si A es una matriz Hermítica de n x n y x es un vector-n complejo entonces 


0 
==x*Ax = A -21 
a x x (A-21) 
[Para obtener las ecuaciones (A-20) y (A-21), véase el problema A-7.] 
Para una matriz real de n x m, un vector-n real x, y un vector-m real y, se tiene 


ð T 

—x Ay = A A-22) 
rd VTN ( 

ð 

N =A'x (A-23) 


De forma similar, para una matriz compleja A de n x m, un vector-a complejo x y un vector-m 
complejo y, se tiene 


d 

E x*Ay = Ay (A-24) 
9 e 

res =A'X (A-25) 
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[Para obtener las ecuaciones (A-22) a (A-25), refiérase al problema A-8.] Observe que la ecuación 
(A-25) es equivalente a la siguiente ecuación: 


ð 
gN = A*x 


A-5 VECTORES Y ANÁLISIS VECTORIAL 


Dependencia lineal e independencia de vectores. Los vectores X;, Xa, .. . , x„ se dicen ser 

linealmente independientes si la ecuación 
CX + GX t cc + CX =O 

donde €;, €», . . . , C, son constantes, implica que c, =c, 5- + + =c, = 0. Por el contrario, los vectores 
Xp Xa .... X, se dicen ser linealmente dependientes si y sólo si x, se puede expresar como una 
combinación lineal de x, (=1,2,...,1 j £ Ò. 

Es importante observar que si los vectores Xx, X», ..., X, son linealmente independientes y los 
vectores Xi, X», ..., Xy, X, + SON linealmente dependientes, entonces x,.., se puede expresar como una 
combinación lineal única de X,, Xa, ..., Xp 


Condiciones necesarias y suficientes para la independencia lineal de vectores. Se puede 
probar que las condiciones necesarias y suficientes para que los vectores x, (¿=1,2,...., m1) sean 
linealmente independientes son que: 


l. m<n. 
2. Exista al menos un determinante de columna- no cero de la matriz de n x m cuyas columnas 
consistan de X}, Xa,- Xy. 
Por lo tanto, para los 7 vectores X,, Xa, . . . , X, la condición necesaria y suficiente para la independen- 


cia lineal es que 
[A| #0 
donde A es una matriz de n x n cuya columna ¡está hecha de los componentes de x, (¿=1,2,..., 7). 
Producto interno. Cualquier regla que asigna a cada par de vectores x y y en un espacio 


vectorial una cantidad escalar se llama producto interno o producto escalar y se simboliza por (x, y), 
si se considera que los cuatro axiomas siguientes se satisfacen: 


1. (y, x) = (x, y) 
donde ta barra denota el conjugado de un número complejo 
2. (cx, y) = C(x, y) = (x, Cy) 


donde c es un número complejo 





3. (x ty, z +w) = (x, 2) + (y, 2) +(x, w) + (y, w) 
4. (x, x) > 0, para x + 0 
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En cualquier espacio vectorial finito, existen muchas definiciones del producto interno, todas satis- 
facen los cuatro axiomas. 

En este libro, a menos de que se especifique otra cosa, se adoptará la siguiente definición de 
producto interno: el producto interno de un par de vectores-n x y y en un espacio vectorial V está 
dado por 


(x,y) = TY + Xaya A + Y = È Fiyi (A-26) 
i=l 


donde la suma es un número complejo y donde las x; son los complejos conjugados de los x,. Esta 
definición claramente satisface los cuatro axiomas. El producto interno también se puede expresar 
como: 


(x,y) = x*y 
donde x* denota la transpuesta conjugada de x. Asimismo 
(x,y) = (9,09 = y*x = yx = x*y (A-27) 


El producto interno de dos vectores-n x y y con componentes reales está dado por 
(x,y) = Xy + Xaya + oo AX Y F Y xy: (A-28) 
Fi 


En este caso, es claro que se tiene 
(x, y)=x" y=y'x, para vectores reales de x y y 


Se hace notar que el vector x real o complejo se dice normalizado si (x, x) = 1. También se 
señala que, para un vector-n, x, x*x es un escalar no negativo, pero xx* es una matriz de n x n. Es 
decir, 


XFX = (x, X) = XX + XX tee + Xxx 
= lx? + leo? + ++ + [xn 
y 
XX XXa -... XX 
E 1x1 X EN XXn 
XXi XXa 0 XX 


Observe que, para una matriz compleja A de n x n y vectores-n complejos x y y, el producto 
interno de x y Ay y el de A*x y y son el mismo, o 


(x, Ay) = x*Ay, — (A*x, y) = x*Ay 


De forma similar, para una matriz real de n x n y vectores-n reales x y y, el producto interno de x y 
Ay y el de A” x y y son el mismo, o 


(x, Ay) =x Ay, — (Ax, y) = x" Ay 
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Transformaciones unitarias. Si A es una matriz unitaria (es decir, si A? = A* ), entonces el 
producto interno (x, x) es invariante bajo la transformación lineal x = Ay, porque 
(x,x) = (Ay, Ay) = (y, A*Ay) = (y, A”? Ay) = (y, y) 
Dicha transformación x = Ay, donde A es una matriz unitaria, que transforma Y'_, xx, en Y'_, YY» 


se llama transformación unitaria. 


Transformaciones unitarias, Si A es una matriz unitaria (es decir, si A | = A*), entonces el 
producto interno (x, x) es invariante bajo la transformación lineal x = Ay, porque 


(x, x) = (Ay, Ay) = (y, A7 Ay) = (y, A”? Ay) = (y, y) 


Dicha transformación x = Ay, que transforma a 3” x? en Y)_,)7, se llama una transformación 
ortogonal. 


Normas de un vector. Una vez definido el producto interno, se puede emplear este producto 
interno para definir las normas de un vector. El concepto de norma es de alguna forma similar al del 
valor absoluto. Una norma es una función que asigna a cada vector x en un espacio vectorial dado un 
número real denotado por [[x!| tal que 


1. lxi] > 0, para x + 0 
2. Ixl = 0, si y sólosix=0 
3. lkxl] = |k] (xl, 
donde k es un escalar y |k] es el valor absoluto de k. 
4. lx + y|] < lx] + llyll, para toda x y y 
5. Kx, y < ixl] Ily] (desigualdad de Schwarz) 


Definiciones distintas de normas se encuentran en los libros. Sin embargo, la siguiente defini- 
ción se utiliza ampliamente. Una norma de un vector se define como la raíz cuadrada no negativa de 


(x, x): 





ixil = (x, x)" = (x*x)"? = Vix +o +- + enf (A-29) 


Si x es un vector real, la cantidad [|x|]? se puede interpretar de manera geométrica como la distancia 
desde el origen al punto representado por el vector x. Observe que 


IIx 5 yll = (xX— y,x = y)” = MN (xı = y) + a -= yay AA (Xn = y,” 


Las cinco propiedades de las normas listadas antes pueden ser obvias, excepto quizá las dos 
últimas desigualdades. Estas dos desigualdades se pueden probar como sigue. De las definiciones 
del producto interno y de la norma, se tiene 


Ax + yi? = (Ax + y, àx + y) = (àx, àx) + (y, àx) + (Ax, y) + (y, y) 
= Alx + A(y,x) + A(x, y) + Ily]P 
= A (Alx + (x, y)) + A(x, y) + Ivi > 0 
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Si se escoge 





_ (y) 
À=- E” para x +0 
entonces 
—— x, y Xx, 
X&Y) + ly = sea + Iy? = 0 
y 


IxiPllyI? > (y yyy) = Kx, y, parax #0 
Para x = 0, es claro que 
IxiPliyi? = Kx, y)? 
Por lo tanto, se obtiene la desigualdad de Schwarz, 
Kx, y| = lx ly] (A-30) 
Al emplear la desigualdad de Schwarz, se obtiene la siguiente desigualdad, 
l lx + yi = Ixi + llyl (A-31) 
Esta se puede probar fácilmente, ya que 
Ix + yi? = x + y, x + y) 
= (x,x) + (x,y) + (y,x) + (y, y) 
= (xP + (x, y) + (x, y) + vil 
= jx? + jiyi? + 2 Re(x, y) 
= ixi? + Iyl? + 21x, y) 
= lx]? + ly? + 2x8 yl 
= (lx! + Iyl)? 


Las ecuaciones (A-26) hasta la (A-31) son útiles en la teoría de control moderna. 
Como ya se mencionó, existen diferentes definiciones de normas. Tres de estas definiciones 


son las siguientes. 


1. Una norma ||x|| se puede definir como sigue: 
lx = [(Tx)* (M9)? = (x*T*Tx)"? = (x*Qx)"? 
non 1/2 
[Żur] =0 
i=l j= 
La matriz Q = T*T es Hermítica, ya que Q* = T*T = Q. La norma [|x| = (x*Qx)'? es una 


forma generalizada de (x*x)'?, la cual se puede escribir como (x*Ix)??. 
2. Una norma se puede definir como la suma de las magnitudes de todos los componentes x;: 


i= Y bal 


E =1 
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3. Una norma se puede definir como el máximo de las magnitudes de todos los componentes x;: 
Ixi = max (lx.[) 
i 
Se puede mostrar que las diferentes normas que se acaban de definir son equivalentes. Entre 


otras definiciones de normas, la norma (x*x)'? es la que más se utiliza en cálculos explícitos. 


Normas de una matriz. El concepto de normas de un vector se puede extender a las matri- 
ces. Existen varias definiciones diferentes de normas de una matriz, algunas de ellas son las siguien- 
tes. 

1. Una norma ||A]| de una matriz A de n x n se define por 
IA] = min k 
tal que 
Axl] = klixll 
Para la norma (x*x)"", esta definición es equivalente a 


lA]? = max (x*AFAx; x*x = 1) 


que significa que ||A|? es el máximo del “valor absoluto” del vector Ax cuando x*x = 1. 
2. Una norma de una matriz A de n x n se puede definir por 


[Al = 22 la; 


donde |a,| es el valor absoluto de a. 
3. Una norma se puede definir como 


n on 1/2 
IAI = ( 22 la.) 
i=1j=1 
4. Otra definición de una norma está dada por 


All = max ( $ fax) 
I j=1 
Observe que todas las definiciones de normas de una matriz A de n x n tiene las siguientes 
propiedades: 
1 ¡A = AF] o AI = IA" 
2 A + B|] = JA]| + |B| 
3. ¡AB] = JA] |B| 
4 Axí] = [A] iix] 
Ortogonalidad de vectores. Si el producto interno de dos vectores x y y es cero, o (x, y) 
= 0, entonces los vectores x y y se dice que son ortogonales con respecto al otro. Por ejemplo, 


los vectores 
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pa pa 


X = 


0 


> X% = 


0 


o 


> 


1 
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son ortogonales en pares y por lo tanto forman un conjunto ortogonal. 
En un espacio vectorial de dimensión n, los vectores X;,, Xa, . .., Xx, se definen por 


1 0 0 

0 1 0 
Xx = > x= aJ > X, = 

0 0 1 


satisfacen las condiciones (x, x} = Ó,, O 


a,x) = 1 
(Xi, X¡) = 0, i +j 
donde ;, j= 1,2,..., 7. Dicho conjunto de vectores se dice ortonormal, ya que los vectores son 


ortogonales a cada uno de los otros y cada vector está normalizado. 

Un vector x no cero se puede normalizar al dividir x entre ([x[[. El vector normalizado x/||x|| es 
un vector unitario. Los vectores unitarios X;, X» . . . , X, forman un conjunto ortonormal si son 
ortogonales por pares. 


Considere una matriz unitaria A. Al dividir a A en vectores columnas A,, A,,..., A, se tiene 
AR 
Aj pa 
AFA = [--[[A/:A2: i An] 

ro 
ATA, AA, AŤ An 

_|AJA, AJA, AJA, 
AFA; AA, A; A, 
10° 0 

J0 1 0 
0 0 1 

de donde 
AFA; = (A, A;) = 1 


Por lo tanto, se ve que los vectores columna (o vectores renglón) de una matriz unitaria A son 
ortonormales. Los mismo es verdadero para matrices ortogonales, ya que son unitarias. 
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A-6 VALORES PROPIOS, VECTORES PROPIOS Y TRANSFORMACIONES DE SIMILITUD 


En esta sección se revisarán propiedades importantes del rango de una matriz y después se darán 
definiciones de valores propios y vectores propios. Por último, se discutirán las formas canónicas de 
Jordan, las transformaciones de similitud y la traza de una matriz de n x n. 


Rango de una matriz. Una matriz A se dice de rango m si el número máximo de renglones (o 
columnas) linealmente independientes es m. Por lo tanto, si existe una submatriz M de m x m de A 
tal que [M]| 4 0 y el determinante de cada submatriz de r x r (donde r > m + 1) de A es cero, entonces 
el rango de A es m. [Observe que, si el determinante de cada submatriz de A de (m + 1) x (m+ 1) es 
cero, entonces cualquier determinante de orden s (donde s > (m + 1)) es cero, ya que cualquier 
determinante de orden s > (m + 1) se puede expresar como una suma lineal de determinantes de 
orden m + 1.] 


Propiedades del rango de una matriz. A continuación se enumeran algunas propiedades 
importantes del rango de una matriz. 


1. El rango de una matriz es invariante bajo el intercambio de dos renglones (o columnas), o la 
suma de un escalar múltiplo de un renglón (o una columna) en otro renglón (o columna), o 
la multiplicación de cualquier renglón (o columna) por un escalar no cero. 

2. Para una matriz A de n x m, 


rango A < min (n, m) 


3. Para una matriz A de n x n, una condición necesaria y suficiente para que el rango A = n es que 
¡Aj + 0. 
4. Para una matriz A de n x m, 


rango A*=rangg A Oo rango A’ = rango A 


5. El rango de un producto de dos matrices AB no puede exceder al rango de A o al rango de B; 
es decir, 


rango AB < min (rango A, rango B) 


Por lo tanto, si A es una matriz de n x 1 y B es una matriz de 1 x m, entonces el rango AB = 1 
a menos de que AB = 0. Si una matriz tiene rango 1, entonces esta matriz se puede expresar 
como un producto de un vector columna por un vector renglón. 

6. Para una matriz A de n x n (donde |A| + 0) y una matriz B de n x m, 


rango AB = rango B 
De forma similar, para una matriz A de m x m (donde |A| + 0) y una matriz B de n x sn, 
rango BA = rango B 
Valores propios de una matriz cuadrada. Para una matriz A de n x n, el determinante 
[AI — Al 


se denomina polinomio característico de A, que es un polinomio de grado n en A. La ecuación 
característica está dada por 
lAI—A|=0 
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Si el determinante ¡Al — A| se expande, la ecuación característica se convierte en 


À= dy Tay ii TA in 

Tn Ada +** Ta 

AI- A] = g 5 
Tân Tam + À — Ann 


= Mad +++, A+a,=0 

Las n raices de la ecuación característica se denominan valores propios de A. También se llaman 
raices características. 

Se hace notar que una matriz real A de n x n no necesariamente tiene valores propios reales. 
Sin embargo, para una matriz real A de 7 x n, la ecuación característica JA] — A] = 0 es un polinomio 
con coeficientes reales, y por lo tanto cualquier valor propio complejo debe ocurrir en pares conju- 
gados; es decir, si a + j8 es un valor propio de A, entonces a — jB también es un valor propio de A. 

Existe una relación importante entre los valores propios de una matriz A de n x n y los de 
A”. Si asumimos los valores propios de A son A, y los de A ' hasta u, entonces 


UEA ¡=1,2,...,1 


Es decir, si A, es un valor propio de A, entonces a;' es un valor propio de A~. Para probar esto, 
observe que la ecuación característica de la matriz A se puede escribir como 


AI- Aj = JAA™ — MA] = JAJA? — ATINA] =0 


ATI AT =0 
Por suposición, la ecuación característica de la matriz inversa A”! es 
WI- A“ =0 
Al comparar estas dos ecuaciones, se ve que 
por? 


Por lo tanto, si A es un valor propio de A, entonces y. = A! es un valor propio de A~'. 
Por último, observe que es posible que, para dos matrices cuadradas A y B, 


JAI — AB! = [AI — BA] 
(Para la prueba, véase el problema A-9.) 


Vectores propios de una matriz de n x n. Cualquier vector x, no cero tal que 


se dice que es un vector propio asociado con un valor propio A, de A, donde A es una matriz de n x 
n. Como los componentes de x; se determinaron de un conjunto de » ecuaciones algebraicas homo- 
géneas lineales con un factor constante, si x, es un vector propio, entonces para cualquier escalar œ + 
0, ax, es también un vector propio. El vector propio se dice ser un vector propio normalizado si su 
longitud o valor absoluto es la unidad. 


www.FreeLibros.me 


Sección A-6 Valores propios, vectores propios y transformaciones de similitud 651 


Matrices similares. Las matrices A y B n X n se dice que son similares si existe una matriz 
P no singular tal que 


PAP =B 
La matriz B se dice que se obtiene a partir de A mediante una transformación de similitud, en la que 


P es la matriz de transformación. Observe que A se puede obtener de B mediante una transformación 
de similitud con la matriz de transformación P”', ya que 
A = PBP! = (P ')'B(P"') 

Diagonalización de matrices. Si una matriz A de n x n tiene n valores propios distintos, 
entonces existen n vectores propios linealmente independientes. Si la matriz A tiene valores propios 
múltiples con multiplicidad k, entonces existe al menos uno y no más de k vectores propios linealmente 
independientes asociados con estos valores propios. 

Si una matriz de n x n tiene n vectores propios linealmente independientes, se puede diagonalizar 
mediante una transformación de similitud. Sin embargo, una matriz que no tenga un conjunto com- 
pleto de 7 vectores propios linealmente independientes no puede ser diagonalizada. Dicha matriz se 
puede transformar en la forma canónica de Jordan. 


Forma canónica de Jordan. Una matriz J de k x k se dice estar en la forma canónica de 
Jordan si 


0 h 


donde las J, son matrices de p, x p, de la forma 


A 1.0 --- 00 
0. 1 -- 0.0 
A ee 
000- A 1 
000. 0A 


Las matrices J, se llaman bloques de Jordan de orden p,. Observe que la À en J, y aquella en J, 
puede ser o no la misma, y que 


P+Pp + co +p =k 








Por ejemplo, en una matriz J de 7 x7,sip,=3,p,=2,p,=1,p,= 1, y los valores propios de J son 
Aj, Ay, Aj, Ay, Aj, Aj, As, entonces la forma canónica de Jordan puede estar dada por 
(A) 0 à 1 0; o] 
0 A 1! 
0.0 A 
po JA) SY A ' AAA 1 
d tA li 
EA 
JA) Aj 
0 JO A 
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Observe que una matriz diagonal es un caso especial de la forma canónica de Jordan. 

La forma canónica de Jordan tiene las propiedades de que los elementos sobre la diagonal 
principal son los valores propios de A y de que los elementos inmediatamente arriba (o abajo) de la 
diagonal principal son 1 o 0 y todos los demás elementos son cero. 

La determinación de la forma exacta del bloque de Jordan puede no ser simple. Para ilustrar 
algunas estructuras, considere una matriz de 3 x 3 que tiene un valor propio triple de A,. Entonces 
una de las siguientes formas canónicas de Jordan es posible: 


à 1 0 M 1/0 AiO O 
0% 1) fO AJ/0| JONIO 
0 0 à 0 0TA 0 00» 


Cada una de las tres matrices anteriores tiene la misma ecuación característica (A ~ A)? = 0. La 
primera corresponde al caso donde existe un solo vector propio linealmente independiente, ya que al 
denotar a la primera matriz como A y al resolver la siguiente ecuación para x, 


(A gi Ay Dx = 0 


se obtiene un solo vector propio: 


$ a = constante no cero 


La segunda y tercer matrices tienen, respectivamente, dos y tres vectores linealmente independien- 
tes. (Observe que sólo la matriz diagonal tiene tres vectores linealmente independientes.) 

Como se ha visto, si una matriz A de k x k tiene k valores propios múltiples, entonces se puede 
mostrar lo siguiente: 


1. Sielrango de AI -— A es k- s (donde I < s < k), entonces existen s vectores propios linealmente 
independientes asociados con À. 

2. Existen s bloques de Jordan asociados con los s vectores propios. 

3. La suma de los órdenes p; de los bloques de Jordan es igual a la multiplicidad k. 


Por lo tanto, como se demostró en las matrices de 3 x 3 anteriores, aun si la multiplicidad de 
los valores propios es la misma, el número de bloques de Jordan y sus órdenes pueden ser diferentes 
en función de la estructura de la matriz A. 


Transformación de similitud cuando una matriz de n x n tiene valores propios distintos. Si 
los n valores propios de la matriz A son diferentes, existe un vector propio asociado a cada valor 
propio A,. Se puede probar que dichos n vectores propios xy, Xz . . - , X, son linealmente independien- 
tes. 

Sea una matriz P de n x n 


donde el vector columna P; es igual al vector columna x, O 


P, = x;, ¡=1,2,...,n 
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La matriz P definida de esta forma es no singular, y P”! existe. Observe que los vectores propios x4, 
X», - - . , X, satisfacen la ecuación 


Ax; == A1X; 
Ax) = À2 X2 
AX, = Àn Xn 


se pueden combinar estas n ecuaciones en una, como sigue 


Ài 0 
a A 
Alx xo iso x] = [x1 0x0 000! xa] 
0 Àn 
o, en términos de la matriz P, 
A 0 
AaP=P| 2 
0 Àn 


Al premultiplicar esta última ecuación por P”', se obtiene 


A 0 
PAP = Taa, = diag (A1, Àz,- . , Àn) 
0 Àn 


Por lo tanto, la matriz A se transforma en una matriz diagonal mediante una transformación de 
similitud. 
El proceso que transforma la matriz A en una matriz diagonal se llama diagonalización de la 
matriz A. 
Como se estableció anteriormente, un múltiplo escalar del vector propio x, es también un 
vector propio, ya que &x, satisface la siguiente ecuación: 


A(ax;) = Aj(ax;) 


En consecuencia, se puede escoger « para que la matriz P sea tan simple como sea posible. 

Para resumir, si los valores propios de una matriz A de n x n son distintos, entonces hay 
exactamente n vectores propios que son linealmente independientes. Una matriz de transformación 
P que transforma a A en una matriz diagonal se puede construir de los » vectores propios linealmente 
independientes. 


Transformación de similitud cuando una matriz de n x n tiene valores propios múltiples. Se 
supone que una matriz A de n x n involucra un valor propio A, de multiplicidad k y otros valores 
propios Az. 1, Ags 2) + - - » A, que son distintos y diferentes de A,. Es decir, los valores propios de A son 


Ar Ar). Ass Ago Ago + Àn 
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Primero se considerará el caso cuando el rango de A, I — A es n — 1. Para este caso existe un solo 
bloque de Jordan para el valor propio múltiple A,, y existe un solo vector propio asociado con este 
valor propio múltiple. El orden del bloque de Jordan es k, que es el mismo que el orden de la multi- 
plicidad del valor propio A.. 

Observe que, cuando una matriz A de n x n no tiene n vectores propios linealmente indepen- 
dientes, no puede ser diagonalizada, pero se puede reducir a una forma canónica de Jordan. 

En el presente caso, sólo existe un vector propio linealmente independiente para A,. Ahora se 
investigará si es posible encontrar k- 1 vectores que estén asociados de alguna forma con este valor 
propio y que sean linealmente independientes de los vectores propios. Sin prueba, se mostrará que 
esto es posible. Primero, observe que el vector propio x, es un vector que satisface la ecuación 


(A = A Dx, =0 


por lo que x, se elimina mediante A — A,1. Como no se tienen suficientes vectores que son eliminados 
por A ~À, I, se buscan vectores que sean eliminados por (A — A, P’, (A — À; IP, y así sucesivamente, 
hasta obtener k — 1 vectores. Los k — 1 vectores determinados de esta forma se llaman vectores 
propios generalizados. 

Se definen los k— 1 vectores propios generalizados como X,, X3, . . . , X} Entonces estos k— 1 
vectores propios generalizados se pueden determinar de las ecuaciones 


(A > A Dx; =0 
(A = à D x =0 


(A — à Dx =0 (A-32) 
que se pueden rescribir como 
(A = A Dx; =4 
(A — A Dx, = xi 
(A = A Dxi = Xx-1 
Observe que 
(A => A Dx, = (A = A11)? xX SER (A E Ar Dx, = X; 
o 
(A — À; Dx, = Xi (A-33) 
El vector propio x, y los k— 1 vectores propios generalizados X,, X3, . . . , X, determinados de esta 


forma constituyen un conjunto de k vectores linealmente independientes. 

Una forma adecuada para determinar los vectores propios generalizados es comenzar con Xx, 
Es decir, se determina el x, que satisfará la ecuación (A-32) y al mismo tiempo se obtendrá un vec- 
tor no cero que (A —A, If~ x,. Cualquiera de estos vectores no cero se puede considerar un vector 
propio posible x,. Por lo tanto, para encontrar el vector propio x,, se aplica un proceso de reducción 
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por renglón a (A —A, D' y se encuentran k vectores linealmente independientes que satisfacen la 
ecuación (A-32). Entonces estos vectores se prueban para encontrar uno que dé un vector no cero en 
el lado derecho de la ecuación (A-33). (Observe que se comienza con x, entonces se deben hacer 
selecciones arbitrarias en cada paso para determinar X,, Xz, . . . , Xẹ Esto consume tiempo y no es 
conveniente. Por esta razón, este enfoque no se recomienda.) 

Para resumir lo que se ha discutido, el vector propio x, y los vectores propios generalizados x,, 
Xz, . . . , X satisfacen las siguientes ecuaciones: 

AX; = ÀX; 


AX = X; + AX 


AX; = X- + Ài Xg 
Los vectores propios X4 +1, Xy+2, - - - , X, asociados con los valores propios distintos A, 1, Ag+2» +++ 
A,, respectivamente, se pueden determinar de 
AX = Àk+1 Xk+ 


AXg+2 = Àk+2Xk+2 


AX, = An Xn 


Ahora se define 


donde los n vectores columnas de S son linealmente independientes. Por lo tanto, la matriz S es no 
singular. Entonces, al combinar las ecuaciones de los vectores propios anteriores y las ecuaciones de 
los vectores propios generalizados en una sola ecuación, se obtiene 





A[x, Xite iX Xg itte Xn 

de i 0 0] 

À 1 i 

= [xixi X Xi Xa] Lo 
` a o A ETES à e La 
0 | Àk+1 0 
0 0 An] 

De donde 
BAD UN 
AS =S 4i 
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Al premultiplicar esta última ecuación por S', se obtiene 


En la discusión anterior se consideró el- caso en el que el rango de A, 1- A eran—1. A 
continuación se considera el caso en el que el rango de A, 1— A es n — s (donde 2 < s < n). Ya que la 
matriz A involucra k valores propios múltiples A, y otros valores propios A¿+1, Aj+2» <- - > A, que SON 
distintos y diferentes de A,, se tienen s vectores linealmente independientes asociados con el valor 
propio A;. Por lo tanto existen s bloques de Jordan que corresponden al valor propio À}. 

Por conveniencia en la notación, se define los s vectores propios linealmente independientes 
asociado con el valor propio A, como Vij, Vap . - . , Vg. Se define a los vectores generalizados asocia- 
dos con V; COMO Vz, Vi» + + +, Vp donde ¡=1,2,...,s. Entonces existen en total k vectores (vectores 
propios y vectores propios generalizados), que son 


Viis Yi»... > Vipp V21, V22; e > V2p7> no.) Vs) Voz) -. > > Ysp, 


Los vectores propios generalizados se determinaron a partir de 


(A > Ay Dva = 0, O (A a A Dv Gaj 0 

(A — ADvo = Vi, OREA (A — A Dya = Ya 

(A > Ai Dv, = Vipi-1s Fr (A E àa DY sp, = Vsp,-1 
donde los s vectores propios Vj}, V2 . . - , V,, SON linealmente independientes y 


pitpt FR 


Observe que p;, P», . . . , p, representan el orden de cada uno de los s bloques de Jordan. (Para 
determinar los vectores propios generalizados, se sigue el método discutido antes. Para ejemplificar 
los detalles, véase el problema A-11.) 


Se define una matriz de n x k que consiste de v;,, Via, . . . , Vy, COMO 
S(A1) = [vni vni E Vp e vaivai] va] 
ES E: xı] 
= [S SiiS] 
y se define 
S = [S(A;) :Sirr:Sir2 io 0028.) 
= [S,:S,:---:S,] 
donde 
Sii 5 Xktis Skaz = Xka, miesa S, =x, 
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Observe que X¿+ 1, Xy +2 +. - > X, Son los vectores propios asociados con los valores propios Ay, 
Àk- >- -> Àp respectivamente. La matriz S definida de esta forma es no singular. Ahora se obtiene 
TN, (Ar) 0 l 0] 
J, (A) 
AS=S| 0 J (A): 0 
RS: 0 TV Ago 0 
| 0 0 An 








donde J, (A) está en la forma 


Ar 1 0 
à 1 
J, (à) = 
1 
0 mM 
que es una matriz de p, x p, De donde, 
MT, (A) 0! 07 
Jà) | 
SIAS=| 0 BESS 
AA O T Aea 0 
0 0 An 








Por lo tanto, se ha mostrado que, al utilizar un conjunto de n vectores linealmente indepen- 
dientes (vectores propios y vectores propios generalizados), cualquier matriz de n x n se puede 
reducir a una forma canónica de Jordan mediante una transformación de similitud. 


Transformación de similitud cuando una matriz de n x n es normal. Primero, se recuerda 
que una matriz es normal si es real simétrica, Hermítica, real anti-simétrica, anti-Hermítica, ortogonal, 
o una matriz unitaria. 

Suponga que una matriz normal de n x n tiene un valor propio A, de multiplicidad k y que sus 
otros n — k valores propios son distintos y diferentes de A,. Entonces el rango de A — A, les n — k. 
(Refiérase al problema A-12 para la prueba.) Si el rango de A — A, Les n— k, hay k vectores propios 
Xp X>, . - - , Xy linealmente independientes que satisfacen la ecuación 


(A-ADx,=0, i=1,2,...,k 


Por lo tanto, existen k bloques de Jordan para el valor propio A,. Ya que el número de bloques de 
Jordan es el mismo que la multiplicidad del valor propio A,, todos los bloques de Jordan son de 
primer orden. Como los n — k valores propios restantes son distintos, los vectores propios asociados 
con estos valores propios son linealmente independientes. Por lo tanto, la matriz normal de n x n 
tiene en total » vectores propios linealmente independientes, y la forma canónica de Jordan de la 
matriz normal es una matriz diagonal. 
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Se puede probar que si A es una matriz normal de n x n, entonces, sin importar que los valores 
propios incluyan valores propios múltiples, existe una matriz unitaria U de n x n tal que 


UT AU = U*AU = D = diag(A¡,A2,..., Àn) 


donde D es una matriz diagonal con sus valores propios en la diagonal principal. 
Traza de una matriz den x n. La traza de una matriz A de n x n se define como sigue: 
traza de A =tr A = y d; 
La traza de una matriz A de n x n tiene las siguientes propiedades: 


L trA? =trA 
2. Para las matrices A y B de n x n, 
tr(A + B) =trA + trB 


3. Silos valores propios de A se denotan como Ay, Àz, ..., Àp entonces 
trA=A+A4%>+:c +A, (A-34) 
4. Para una matriz A de n < m y una matriz B de m x n , sin importar que AB = BA o AB + BA, 
se tiene 
n m 
tr AB = tr BA = 5 ` di; bji 
i=1j=1 
Sim = l, entonces al escribir A y B como a y b, respectivamente, se tiene 


trab = ba 
De donde, para una matriz C de n x m, se tiene 
a Ca = traaC 


Observe que la ecuación (A-34) se puede probar como sigue. Al emplear una transformación 
de similitud, se tiene 


P | AP = D = matriz diagonal 


S“ AS = J = forma canónica de Jordan 
Es decir 
A = PDP” o A = SJS" 
De donde, al emplear la propiedad 4, se tiene 
trA = trPDP™` = trP PD = trD = A + àrt tAn 
De forma similar, 


trA = trSJS =trS SJ] = trJ =à + Ate + An 
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Propiedades invariantes bajo transformaciones de similitud. Si una matriz A de n x n se 
puede reducir a una matriz similar que tenga una forma simple, entonces se pueden observar las 
propiedades importantes de A. Una propiedad de una matriz se dice invariante si ésta es poseída por 
matrices similares. Por ejemplo, el determinante y el polinomio característico son invariantes bajo 
transformaciones de similitud, como se muestra a continuación. Suponga que P~ AP = B. Entonces 


|B| = |P"" AP] = [PI 1A][P| = |A]|P-"1]P| = |A| |P*P] 
= |A] |I] = JA] 


AL — B| = JAI — PAP] = |P-(AI)P — P~ AP] 
= [PAI — A)P| = |P™'||AI — A| |P] 
= [AI — A| |P |P] = [A1 — A| 


Observe que la traza de una matriz es también invariante bajo transformaciones de similitud, como 
se mostró anteriormente: 


trA = trP AP 


Sin embargo, la propiedad de simetria de una matriz no es invariante. 

Observe que sólo las propiedades invariantes de matrices presentan características intrínsecas 
de la clase de matrices similares. Para determinar las propiedades invariantes de una matriz A, se 
examina la forma canónica de Jordan de A, ya que la similitud de dos matrices se puede definir en 
términos de la forma canónica de Jordan como: la condición necesaria y suficiente para que dos 
matrices A y B de n x n sean similares es que la forma canónica de Jordan de A y la de B sean 
idénticas. 


A-7 FORMAS CUADRÁTICAS 
Formas cuadráticas. Para una matriz A real simétrica de 1 x n y un vector-n x real, la forma 
n n 
x’ Ax = Y Y 8,¡X;X;, aj; = aij 
i=1j=1 


se denomina una forma cuadrática real en x, Con frecuencia, una forma cuadrática real se llama 
simplemente forma cuadrática. Observe que x” Ax es una cantidad escalar real. 
Cualquier forma cuadrática real se puede escribir siempre como x” Ax. Por ejemplo, 


1 -1 2 Xi 
2-2 +40 +x+86=[lx xx x*]-1 1 ojx 
2 0 8j; 


Vale la pena mencionar que, para una matriz A real de n x n, se define 


B= (A+A) y  C=>(A-A) 


1 
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entonces 
A=B+C 
Observe que 
B'=B y c”"=-C 


De donde, una matriz real A de n x n se puede expresar como una suma de una matriz real simétrica 
y una matriz real anti-simétrica. Ya que x” Cx es una cantidad escalar real, se tiene 


Xx Cx =(x7Cx) =x"C'x= ~x” Cx 
En consecuencia, se tiene 
x"Cx=0 
Esto significa que una forma cuadrática para una matriz real anti-simétrica es cero. Por lo tanto, 
x” Ax = x"(B + C)x = x" Bx 


y se ve que la forma cuadrática real x' Ax involucra sólo la componente simétrica x“ Bx. Esta es la 
razón por la que la forma cuadrática real se define únicamente por una matriz simétrica real. 
Para una matriz Hermítica A y un vector-n x complejo, la forma 


n n 
x*Ax = 5 Y ayi, lji = 4; 
i=1j=1 


se denomina una forma cuadrática compleja, o forma Hermítica. Observe que la cantidad escalar 
x*Ax es real, porque 


x*Ax = x Ax = (x Ax)! = X Ax = x*Axo 


Formas bilineales. Para una matriz A real de n x n, un vector-n x real, y un vector-m y real, 
la forma 


XT AY = È > ax) 


i=1j=1 


se denomina una forma bilineal real en x, y y, x" Ay es una cantidad escalar real. 
Para una matriz A compleja de n x m, un vector-n x complejo, y un vector-m y complejo, la 
forma 


x*Ay = 5 y Ox iy; 


i=1j=1 
se denomina una forma bilineal compleja. x* Ay es una cantidad escalar real. 


Definición y semidefinición. Una forma cuadrática x” Ax donde A es una matriz simétrica 
real (o forma Hermítica x*Ax, donde A es una matriz Hermítica), se dice ser definida positiva si 


x Ax>0 (o x*Ax > 0), parax + 0 
x Ax=0 (o x*Ax = 0), parax=0 
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x Ax>0 (o x*Ax > 0), parax +0 


x Ax=0 (o x*Ax = 0), parax=0 
x Ax (o x*Ax) se dice ser semidefinida positiva si 


x Ax20 (o x*Ax > 0), parax +0 

x Ax=0 (o x*Ax = 0), para x= 0 
x” Ax (o x*Ax) se dice ser definida negativa si 

x Ax<0  (ox*Ax<0),  parax#0 

x Ax=0 (ox*Ax = 0), parax=0 
x’ Ax (0 x*Ax) se dice ser semidefinida negativa si 

x  Ax<0 (o x*Ax < 0), para x + 0 

x Ax=0 (ox*Ax =0), parax=0 


Si x” Ax (o x*Ax) puede ser de cualquier signo, entonces x’ Ax (o x* Ax) se dice ser indefinida. 

Observe que si x' Ax (o x*Ax) es definida positiva (o negativa) se dice que A es una matriz 
definida positiva (o negativa). De forma similar, A se llama una matriz semidefinida positiva (o 
negativa) si x“ Ax o x*Ax es semidefinida positiva (o negativa); la matriz se llama indefinida si x’ 
Ax o x*Ax es indefinida. 

Observe que los valores propios de una matriz real simétrica o matriz Hermitica de n x 7 son 
reales. (Para la prueba, véase el problema A-13.) Se puede mostrar que una matriz A real simétrica 
o matriz Hermítica de n x n es una matriz definida positiva si todos los valores propios A, (¿= 1,2, 

. , 1) son positivos. La matriz A es semidefinida positiva si todos los valores propios son no 
negativos, o A, 20 (¡=1,2,... mn), y al menos uno de ellos es cero. 

Observe que si A es una matriz definida positiva entonces [A] + 0, ya que todos los valores 
propios son positivos. Por lo tanto, la matriz inversa siempre existe para matrices definidas positi- 
vas. 

En el proceso de determinar la estabilidad de un estado de equilibrio, por lo regular se encuen- 
tra una función escalar V(x). Una función escalar V(x), que es función de x,, x», ..., x, se dice 
definida positiva si 


VG) > 0, parax * 0 
V(0)=0 

V(x) se dice semidefinida positiva si 
V() 20, para x + 0 
v(0)=0 


Si —V(x) es definida positiva (o semidefinida positiva), entonces V(x) se dice definida negativa (o 
semidefinida negativa). 

Las condiciones necesarias y suficientes para que la forma cuadrática x” Ax (o la forma Hermítica 
x*Ax) sea definida positiva, definida negativa, semidefinida positiva, o semidefinida negativa han 
sido dadas por J. J. Sylvester. El criterio de Sylvester es el siguiente 
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positiva es que el determinante de A sea positivo y los menores principales sucesivos del determi- 
nante de A (los determinantes de las matrices de k x k en la esquina superior izquierda de la matriz A, 








donde k = 1,2,...,n-— 1) sean positivos, es decir, se debe tener 
an 4, 4 an 4 
4u > 0, a, y > 0, Ga An an| > 0, IRS JA] >0 
1 22 
da da Q3 
donde 
Aj = Ajo para una matriz A simétrica real 
aj = As, para una matriz A Hermítica 


Criterio de Sylvester para la definición negativa de una forma cuadrática o forma Hermi- 
tica. Una condición necesaria y suficiente para que una forma cuadrática x” Ax (o forma Hermítica 
x*Ax), donde A es una matriz real simétrica (o matriz Hermítica) de n x n, sea definida negativa es 
que el determinante de A sea positivo si n es par y negativo si n es impar, y los menores principales 
sucesivos de orden par sean positivos y los menores principales sucesivos de orden impar sean 
negativos; es decir, se debe tener 








au ap âi Anz ag 
an <0, aa >0, 4 y anj <0, 
1 an 
da dy 43 
JA] > 0 (n par) 
¡A <0 (n impar) 
donde 
aj = Aj para una matriz A real simétrica 
aj= ap, para una matriz A Hermítica 


[Esta condición se puede obtener al hacer que x'(-A)x sea definida positiva. 
p 


Criterio de Sylvester para la semidefinición positiva de una forma cuadrática o forma 
Hermítica. Una condición necesaria y suficiente para que una forma cuadrática x” Ax (o forma 
Hermít:ca x* Ax), donde A es una matriz real simétrica (o matriz Hermítica) de n x n, sea semidefinida 
positiva es que A sea singular (|A| = 0) y los menores principales sean no negativos: 








a a Gi Qij Gik 
ul t 
Gi; Z 0, ma E = 0, Qj Aj) Ajk = 0, OR |A] =0 
Ji J 
f Aki Gk) Ar 
donde i<j < ky 
aj = Ap para una matriz A real simétrica 
aj= Aj, para una matriz A Hermítica 


www.FreeLibros.me 


Sección A-8 Pseudoinversas 663 


(Es importante apuntar que en las pruebas de semidefinición positiva o semidefinición negativa se 
deben revisar los signos de los menores principales, no sólo los de los menores principales sucesi- 
vos. Véase el problema A-15.) 


Criterio de Sylvester para la semidefinición negativa de una forma cuadrática o forma 
Hermítica. Una condición necesaria y suficiente para que una forma cuadrática x” Ax (o forma 
Hermítica x* Ax), donde A es una matriz real simétrica (o matriz Hermítica) de n x n, sea semidefinida 
negativa es que A sea singular (|A| = 0) y los menores principales de orden par sean no negativos y 
aquellos de orden impar sean no positivos: 


Aii Gij Qik 





aj £ 0, p H 0, aj aj ax| S0, eeo’ lA] =0 
i H Aki Ox Akk 
donde i<j <ky 
aj = ap para una matriz A real simétrica 
aj= di, para una matriz A Hermítica 


A-8 PSEUDOINVERSAS 


El concepto de pseudoinversas de una matriz es una generalización de la noción de una inversa. Es 
útil para encontrar una “solución” a un conjunto de ecuaciones algebraicas en el cual el número de 
variables desconocidas y el número de ecuaciones lineales independientes no es igual. 

A continuación, se considerarán las pseudoinversas que permiten determinar soluciones de 
norma mínima. 


Soluciones de norma mínima que minimizan a |x|. Considere una ecuación algebraica 
lineal 


xa+5m=1 


Ya que tiene dos variables independientes y una sola ecuación, no existe una solución única. En 
lugar de esto, existe un número infinito de soluciones. En forma gráfica, cualquier punto en la línea 
xı + 5x, = 1, como se muestra en la figura A-1, es una posible solución. Sin embargo, si se decide 
escoger el punto que está más cerca del origen, la solución se convierte en única. 

Considere la ecuación matriz-vector 


Ax = b (A-35) 


donde A es una matriz de n x m, x es un vector-m, y b es un vector-n. Se supone que m > n (es decir, 
el número de variables desconocidas es mayor que el número de ecuaciones) y que la ecuación tiene 
un número infinito de soluciones. Se va a encontrar la solución única x que está localizada más cerca 
del origen o que tiene la norma ||x]| mínima. 

Se define la solución de norma mínima como x°. Es decir, x° satisface la condición de que Ax? 
= b y [xl] < |x|] para toda x que satisface Ax = b. Esto significa que el punto de solución x° está más 
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Figura A-1 Línea x, + 5x, = 1 en el plano x,x). 
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cerca del origen del espacio de dimensión m entre todas las soluciones posibles de la ecuación 
(A-35). A continuación se determinará dicha solución de norma mínima. 
Matriz pseudoinversa derecha. Para una ecuación vector-matriz 
Ax = b 


donde A es una matriz de n x m que tiene rango a, x es un vector-», y b es un vector-n; la solución 
que minimiza la norma ||x]| está dada por 


x°? = A™ b 


donde A™ = A’ (AA J”. 
Esto se puede probar como sigue. Primero, se nota que la norma |[[x]| se puede escribir de la 
siguiente manera: 


lxii = [ix — x° +10] = [ix] + [pe — xe + 2G0)7(x x°) 
El último término, 2(x9)(x — x°), se puede hacer cero, ya que 
(x)(x — x°) = [A7(AA")' b] [x — AT(AA?) b] 
= b"(AA7) A[x — AAA?) b] 
= PY(AA”) [Ax — (AAD(AA?)b] 
= PAA?)"(b — b) 
=0 
Por lo tanto, 
ixil = lix + ix — x’ 
que se puede rescribir como 
ixi — ixa = [pe — x° 
Como [ix — x°I| > 0, se obtiene 
lb) = Ixe! 


Por lo tanto, se tiene que x° es la solución que da la norma mínima ||x]|. 
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La matriz AY = AY(AA?)' que produce la solución de norma mínima (||x°|| = mínimo) se lla- 
ma la pseudoinversa derecha o inversa derecha mínima de A. 


Resumen sobre la matriz pseudoinversa derecha. La pseudoinversa derecha A da la solu- 
ción x° = A% b que minimiza la norma, o hace que ||x°|| = mínimo. Observe que la pseudoinversa 
derecha A" es una matriz de m x n, ya que A es una matriz de n x m y 


ARU=AT(AA y" 
= (matriz de m x n) (matriz de n x ny” 
= matriz de m x n, m>n 


Observe que la dimensión de AA” es más pequeña que la dimensión del vector x, la cual es m. 

También observe que la pseudoinversa derecha A**Y posee la propiedad de que es realmente una 
q p prop q 

“matriz inversa” si se premultiplica por A: 


AA™ = A[AY(AA?)*] = AA (AAD) = I, 
Solución que minimiza a ||Ax — b||. Considere la ecuación vector-matriz 
Ax =b (A-36) 


donde A es una matriz de n x m, x es un vector-m, y b es un vector-n. Se supone que n > m. Es decir, 
el número de variables desconocidas es más pequeño que el número de ecuaciones. En el sentido 
clásico, puede existir o no alguna solución. 

Si no existe solución, se puede desear encontrar una solución única que minimice la norma 
¡Ax — bl]. Se define una “solución” para la ecuación (A-36) que minimiza a ¡Ax — bj] como x°. En 
otras palabras, x° satisface la condición 


Ax — b]| > Ax? — bill, para toda x 
Observe que x° no es una solución en el sentido clásico, ya que no satisface la ecuación vector- 
matriz original Ax = b. Sin embargo, se puede llamar a x° una “solución aproximada”, ya que mini- 
miza la norma ||Ax — bi]. A continuación se obtendrá una solución aproximada. 
Matriz pseudoinversa izquierda. Para una ecuación vector-matriz 
Ax = b 


donde A es una matriz de n x m que tiene rango m, x es un vector-m, y b es un vector-n, el vector x° 
que minimiza la norma ||Ax — b|| está dado por 


x° = AM b = (ATA) ATb 


donde A'™ = (A" Ay" A”. 
Para verificar esto, primero observe que 


[Ax — bj| = ||A(x — x°) + Ax? — bl 
= [JA(x — x°)|| + [[Ax? — b]] + 2[A(x — x0)]"(Ax? — b) 


El último término se puede mostrar que es cero como sigue: 
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[A(x ~ x°) (Ax° — b) = (x — x°) AY[A(A7 A) A” — 1,]b 
= (x — xY[(ATA)J(ATA) AT — A”]b 
= (x — x)Y(A” — AP)b 
=0 
Por lo tanto, 
Ax — b|| = ||A(x ~ x0)I] + ||Ax° — bl 
Observe que ||A(x — x°)||1 > 0, se obtiene 


Ax — bl] — ¡Ax? — blj = JA(x — xl] = 0 


Ax — bl] = ¡Ax? — bl] 
Por lo tanto, 
x° = A b = (ATA) A”b 
minimiza a ¡Ax — bl]. 
La matriz A™ = (A? A)” A? se llama pseudoinversa izquierda o inversa izquierda minima de 


la matriz A. Observe que A%* es en realidad la matriz inversa de A, en que si se postmultiplica por A 
se obtendrá la matriz identidad l,,. 


AMA = (ATA) ATA = (ATA) (ATA) = L, 


PROBLEMAS DE EJEMPLO Y SOLUCIONES 


Problema A-1 


Muestre que si las matrices A, B, C y D son de n x n, n x m, m x n, y m x m, respectivamente, y si |A| + 
0 y [D| + 0, entonces 
A B| _ jA 0 
0 D IC D 
Solución Como la matriz A es no singular, se tiene 
A B|_JA OJI OJI AB 
0 D 0 IjO DJ[O I 
A B Ā oJI Sl AS 
0 I 


0 D 0 I0 D 


De forma similar, como D es no singular, se tiene 
fs 0 
C D 
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De donde, 














|A| |D] 


= |o ii pleg i = 1411D] 
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Problema A-2 
Muestre que si las matrices A, B, C y D son den x n, nx m, m x n, y m x m, respectivamente, entonces 
la SILA ]%0 
T| DIA-BD~`C), > silD[+0 


E 


se puede escribir como un producto de dos matrices: 


A 0 I, AUB 
C In y 0 D-CA'B 


A B 
C D 


Solución Si |A| + 0, la matriz 








o 
A B ml A OJLL AB 
C D C 1, ||0 D- CA`'B 
Por lo tanto, 
fz B x A OUI A`'B 
C D C 1,10 D- CA`'B 
= |A] En] In| [D — CA”'B| 
= |A| |D — CA™'B| 


De forma similar, si |D| # 0, entonces 
A B|_|I, B A-BD"C 0 
C D 0 D D'C Im 
A-BD'C 0 


lA B| _ |I, 4 

c Dio pil D'C L 
= |I„||D||A — BD™' C| Em 
= |D||A — BD”*C| 


y por lo tanto 





Problema A-3 


Para una matriz A de n x m y una matriz B de m x n, muestre que 


[L, + AB] = |in + BA] 


In -A 
BL, 
Con referencia al problema A-2, 


f Po silA 4+0 
C D| [¡D¡A-BD"C|  si[D¡*0 


Solución Considere la siguiente matriz: 
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Por lo tanto, 








L, -A| _ [ILI + BAJ = [La + BA] 
B Iln IL, IL, + AB| = |L, + AB] 
y se tiene 
[L, + AB| = [I„ + BA| 
Problema A-4 


Si las matrices A, B, C y D son der x n, n x m, m x n, y m x m, respectivamente, entonces se tiene el 
siguiente lema de inversión de matrices: 


(A + BDC)' = A~! — A`'B(D~' + CA™' BY ' CA~’ 

donde se supone que las inversas indicadas existen. Pruebe este lema de inversión. 
Solución Se premultiplican ambos lados de la ecuación por (A + BDC): 

(A + BDC)(A + BDC)' = (A + BDCO)A' — A*B(D' + CAB) *CA 7] 
I = 1 + BDCA™ — B(D"' + CAB) CA~ - BDCA B(D”? + CAB) CA” 

=] + BDCA™' — (B + BDCA BID ' + CA B) CA~ 

= I + BDCA™ — BD(D™ + CA BID" + CAB) CA” 

= 1 + BDCA* - BDCA"' 

=I 

Por lo tanto, se ha probado el lema de inversión de matrices. 

Problema A-5 


Pruebe que si las matrices A, B, C y D son de n x n, n x m, m x n, y m x m, respectivamente, entonces 


-] 
AB A` -A “BD” a 
k d -| 0 D~ | (A-37) 


al considerar que [A] 4 0 y |D| + 0. 


Pruebe también que 
-1 
A 0 A? 0 
É al E me pal (A-38) 


considerando que |A| + 0 y |D] + 0. 


Solución Observe que 


A? -A BD JA B|_[1, A B-A“B|_[L, 0 
0 D° j0 p|7|o L, 0 L, 


Por lo tanto, la ecuación (A-37) está probada. De forma similar 


A“ o [a o]_ I, 0j | 0 
-D7 CA7 DO D|7|-D7C+DC Inj (0 In 


Por lo tanto, se ha probado la ecuación (A-38). 
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Problema A-6 
Pruebe que si las matrices A, B, C y D son de n x n, nx m, mx n, y m x m, respectivamente, entonces 
A B|’ _ [A] +A`B(D- CAB) CA" -A` B(D - CAB)" 
C D -(D - CAB) CA" (D ~- CA~ B)’ 


al considerar que |A| + 0 y |D - CA”! B| + 0. 
También pruebe que 


A B]'"_[  (A- BDC)” -(A — BD"'C) "BD" 
cC D -D'C(A - BDC)’ D'C(A - BDC) BD’ + D~’ 


considerando que |D] + 0 y JA ~ BD” C] 4 0. 


Solución Primero, observe que 
A B|_[A OJI AB 
c D|"|c 1,0 D-CA'B (A33) 
Al tomar la inversa de ambos lados de la ecuación (A-39), se obtiene 
A B]"_[L aB a 0] 
C D 0 D-CA UB Cc L, 
En referencia al problema A-5, se encuentra 


LAB | _[I -A“"B(D-CA'B)" 
0 D-CA“B 0 (D-CA“B)" 


a 0]"_ [at o 
CI, -CA In 


Por lo tanto, -1 E ii 
A B -|h AB A 0 
C D 0 D-CA "B| |C In 
_|L -A B(D-CA"B) "|| A? 0 
0 (D ~ CAB)? -CA Im 
JA? + A`'B(D - CAB) 'CA™ -A'B(D- CAB)” 
-(D - CAB) 'CA`™' (D - CA By" 
si se considera que |A| + 0 y |D - CA” B| # 0. 
De forma similar, observe que 


A B|_[1, B|[A -BDC 0 
le l-l; A DC A sarao 


A! tomar la inversa en ambos lados de la ecuación (A-40) y en referencia al problema A-5, se obtiene 


A Bl _[aA-BD"C o] [n B| 
CD D'C Imj |0 D 


z (A — BDC) o l|1, -BD 
-D~ C(A ~ BDC)" Inl o D“ 

` (A — BDC)" -(A — BD”'C) BD" 
-D` C(A ~ BDC)? D”"'C(A — BDC) BD"! + D~ 


considerando que |D| + 0 y |A — BD” C} 4 0. 
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Problema A-7 
Para una matriz A real simétrica de n x n y dos vector-n x y y, muestre que 
ð T 
a E 
) pr] y 


b) TAS = Ax + A”x 
ôx 


Para una matriz A Hermítica de n x n y un vector-n complejo x, muestre que 


ð 
— y* = 
c) zz Ax = Ax 


Solución 


a) Observe que 


YX = yix + yoo H'et + YX 


que es una cantidad escalar. Por lo tanto 


ð 
AY? yı 
2 Tx= : =|: |= 
ax! j i y 
ð Ty 
FaR Yn 


b) Observe que 


n n 
Di 
x Ax = s s Qi¡XiXj 
i=ij=1 
que es una cantidad escalar. Por lo tanto, 


ð n n n n 
3 zi ax) 2 ayjXj + 5 Ai Xi 
1Vi=1j=1 j=1 i=1 


da DE e 
213 Saz) Y anx; + Y anxi 
Xn \i=1 j=1 j= imi 


= Ax + Ax 


T 
-— xX Ax 
ax” 


que es la ecuación (A-20). 
Si la matriz A es una matriz real simétrica, entonces 


Ax =2Ax, siA=A” 


c) Para una matriz Hermítica A , se tiene 


aon 
x*Ax = 5 Ss aX ¡X; 


im] j=1 


ð n n z n 
= 5 Sasss) Y ajy 


ò oX1 i=1j=1 j=1 5 
—x*Ax = : = E = Ax 
ðX F n on 5 
an E Fr. Anj X; 
Ha 2 204% pe j Xj 
que es la ecuación (A-21). 
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Observe que 


n n n 
(3 5 055) 5 âa Ñi 
im1j=1 imi 


xx = : = 


n \i=1j=1 


Flo 





A E 
Y dx, 


im] 


> 


Por lo tanto, 





ð 
— x* = A* 
q Ax A*x 


1 


Problema A-8 


Para una matriz A de n x m, un vector-n complejo x, y un vector-m complejo y, muestre que 


ð 

— y* = 
a) q Ay = Ay 
b) 2 «*Ay = Ax 

gA 
Solución 


a) Observe que 


x*Ay = D > a,X,y 


¡=1 m1 
Por lo tanto, 


2 y $ 05) S ayj Y; 





ä ðX i=l =1 j=1 
Ay = : = A = Ay 
ð n m z m 
E (3 2 auzis) > anj Yj 
n \i=i j=l ji 
que es la ecuación (A-24). 
b) Observe que 
ð n m _ n z 
3 Žas) Y anx, 
i=} j= i=1 
a = : = : =A 
ð n m al n 
2(3 2 0%) Y Aim Y, 
OY mNimt jmi im 


que es la ecuación (A-25). 
De forma similar, para una matriz real A de n x m, un vector-n real x, y un vector-m real y, se tiene 


e EN e Ay= AT 
A Ay Ay, ay A A x 


que son las ecuaciones (A-22) y (A-23), respectivamente. 


Problema A-9 


Dadas las matrices A y B de n x n, pruebe que los valores propios de AB y los de BA son los mismos, aun 
si AB + BA. 
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Solución Primero, se considerará el caso donde A (o B) es no singular. En este caso, 
[AI — BA| = [11 — A“(AB)JA| = [A (AL — AB)JA[ = [A ">| [AI — ABI [A| = ¡AI — AB] 


A continuación se considerará el caso donde A y B son singulares. Existen dos matrices P y Q no 
singulares de n x n tales que 
L 0 
PAQ = [y ol 


donde I, es la matriz identidad de r x r y r es el rango de A, r < n. Se tiene 


[AT ~ BA| = [AI — Q7’ BAQ] = jaI - Q`’ BP’ PAQ] 


5 _|G, Grj L ol 
a E Jo i 











donde 
Sips Gi G 
“BP 1 11 12 
Q Es de 
Entonces 0 
Es = e Gu | Z Al, q Gi 0 
Jar - BAJ = far | E d AS 
= laL de Gal JAEn] 
Asimismo, JAI — AB| = [AI — PABP"'| = [AI — PAQQ™' BP- '| 
-hr |E Oj Gui Gr 
E ja E JE a 
E Z Gu Gz 
E jı | o 0 | 
p i =~Gi -Gr 
0 AL, -, 





A AIL ig Gnu||AL,-,| 
Por lo tanto, se ha probado que 
JAI — BA] = |AI — AB] 
o que los valores propios de AB y BA son los mismos sin importar que AB = BA o AB + BA. 


Problema A-10 


Muestre que la matriz A de 2 x 2 siguiente tiene dos valores propios distintos y que los vectores propios 
son linealmente independientes uno del otro: 


"E 


Solución Los valores propios se obtienen de 


Entonces normalice los vectores propios. 


pr aj=|* 7? A) A DAD =0 
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como 
A=1 y A,=2 


Por lo tanto, la matriz A tiene dos valores propios distintos. 
Existen dos vectores propios x; y X, asociados con A, y A,, respectivamente. Si se define 


entonces el vector propio x, se puede encontrar de 
Ax; = ÀıXı 


(À I == AJx, =0 


O EE 


xı = constante arbitraria y x, =0 


Al observar que A, = 1, se tiene 


que da 


Por lo tanto, el vector propio x, se puede escribir como 


«= [5-3] 


donde c, + 0 es una constante arbitraria. 
De forma similar, para el vector propio x», se tiene 


Ax = Az X2 


(221 zj A)x2 =0 


SEE 


x-=x2=0 


Al notar que A, = 2, se obtiene 


de donde se obtiene 


Por lo tanto, el vector asociado con A, = 2 se puede seleccionar como 


«= [zs] - [5] 


donde c, + 0 es una constante arbitraria. 
Por lo tanto, los dos vectores están dados por 


a 


El hecho de que los vectores propios x, y x, son linealmente independientes se puede ver del hecho de 
que el determinante de la matriz [x, x,] no es cero: 


www.FreeLibros.me 


674 Análisis vector-matriz Apéndice A 


O Ca 


0 al”? 





Para normalizar los vectores propios, se escoge c; = 1 y c= 2,0 


1 
i 
V2 


Claramente, el valor absoluto de cada uno de los vectores propios se convierte en la unidad y por lo tanto. 
los vectores propios están normalizados. 


Problema A-11 


Obtenga una matriz de transformación T que transforme la matriz 


0 1 0 3 
_|j0O -1 1 1 
Al o 01 
0 0 -1 2 
en la forma canónica de Jordan. 
Solución La ecuación característica es 
A  -—1 0 -3 
0. A+lizl z1] Jà A h 
MA AZ lo aeai 3 
0 0 i1 A+2 


=(à+1ř\=0 
Por lo tanto, la matriz A involucra los valores propios 


Para los valores propios múltiples en —1, se tiene 


-1 -1 0 -3 

20 0-1 -1 
AI1-A= 0 0 -1 -1 
0 0 1 1 


que es de rango 2, o rango (4 — 2). De la condición de rango se ve que debe haber dos bloques de Jordan 
para el valor propio en —1, es decir un bloque de Jordan de p, x p, y otro de p, x p,, donde p; + p, = 3. 
Observe que para p, + p, = 3 hay una sola combinación (2 y 1) para las órdenes p, y p,. Se escoge 


p=2 y p,=1 


Entonces hay un vector propio y uno generalizado para el bloque de Jordan J,, y un vector propio para el 
bloque de Jordan J,,. 

Se define el vector propio y el vector propio generalizado para el bloque de Jordan J,, como v,, y 
Yı» respectivamente, y el vector propio para el bloque de Jordan J,, como v,,. Entonces deben existir los 
vectores Vii, Viz y Vo, que satisfacen las siguientes ecuaciones: 


(A — A Dv. = 0, (A = Az Dva =0 
(A A Dv: = Yi 
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Para A, =—1, A — À, I puede estar dada como sigue: 
11. 0 3 
|0 0 1 1 
A E 
0 0 -1 -1 

Al observar que 
OE a 
00 00 
= E 

A S00 
00 00 


se determina el vector vı, que satisfará la ecuación 


(A = A1 Dv» =0 


y al mismo tiempo hará que (A — A, Dv,> no sea cero. Un ejemplo de dicho vector generalizado v,, puede 
ser 


Q See 


a | a = constante arbitraria no cero 
El vector propio v,, se encuentra como un vector no cero (A — A, Pyp: 

2a 
1 (A z Ar Dvs2 57 

—a 


Ya que a es una constante arbitraria no cero, se escoge como a = 1. Entonces se tiene 


2 -1 
Ya = 1 y Vi = 0 
1 0 
=} 1 
A continuación, se determina v,, para que v,, y Y, sean linealmente independientes. Para v,, se 
escoge 
b +3c 
Va = 73 
c 
=c 


donde b y ¢ son constantes arbitrarias. Se escoge, por ejemplo, b = 1 y c = 0. Entonces 


1 
-1 
0 
0 


Es claro que, Vin Viz Y Y2, SON linealmente independientes. Se definen 


Ya = 


Vu = Xi, Viz = X2, Va = X3 


www.FreeLibros.me 


676 Análisis vector-matriz Apéndice A 


2 Ti 1 
TA) => [vn Eviva] = [x *Xo X3] = i : E 
-1 1 0 
Para el valor propio distinto A, = 0. el vector propio x, se puede determinar de 
(A — As Dx, =0 
Al observar que 
0 1 0 3 
_ A IO =T 1 1 
A-=Al=A= 0.0.0 1 
0 0-1 -2 
se encuentra 
d 
-10 
“=t0 
0 
donde d + ( es una constante arbitraria. Al seleccionar a d = 1, se tiene 
1 
0 
T(As) = X= 0 
0 
Por lo tanto. la transformación T se puede escribir como 
2 -1 1 1 
; 1 0 -1 0 
T= [T(A) :TA)] T 1 0 0 0 
-1 1 0.0 
Entonces 
0 0 1 OjO 1 0 3 2 -1 1 1 
1 _p0 0 1 10 -1 1 1 1 0 -1 0 
T AT=]ð -1 1o0olo o o if da 0o 00 
l1 1 -2 1ıJLO0 0-1 ~2jL-1 1 00 
-1 1; 0 0 
0 -1i 0 0 ? 
= 0 En o = diag [J(—1), J,.(-1),3,(0)] 
o 0 0'0 


Problema A-12 


Suponga que una matriz normal A de n x n tiene un valor propio A, de multiplicidad k. Pruebe que el 
rango de A— A, Feesn- k. 


Solución Suponga que el rango de A — A, I es n—m. Entonces la ecuación 


(A-ADx=0 (A-41) 
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tendrá m vectores solución linealmente independientes. Se escogen los 1 vectores de forma que sean 
ortogonales y normalizados. Es decir Xj. Xo..... x,, Ssatisfará la ecuación (A-41) y serán ortonormales, 


Se consideran los n — m vectores Xps i Xpan- X, tales que todos los z vectores 


Xi, X2, .. -Xn 
serán ortonormales. Entonces la matriz U. se define como 


U= f[xixi ix] 
es una matriz unitaria. 
Ya que | </< m, se tiene 


Ax; = Ài X; 
y por lo tanto se puede escribir 


_plA Ll, B 
AU=U 0 3 


10) 


U*AU = es B 
Al observar que 
Ax, — Ax? = ((A — ADx,, (A — ADx,) 
= ((A* — AD(A — ADXx,, xo) 
= ((A — AD(A* — ADx,, x;) 


= ((A* — ADx,, (A* — AD)x;) 


= A*x, — Axil? 
=0 
se tiene 
A*x; = AXi 


Por lo tanto, se puede escribir 


C 
o 
AiIm B; 
*A*D = 
U*A*U | 0 al 
De donde. 


Mla O — | Ailim A E O0 
| 0 el sil odie dal IN E a ad le TA: 
Al comparar los lados izquierdo y derecho de esta última ecuación. se obtiene 
B=0 
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Por lo tanto, se obtiene 


Entonces 


me y (Ar > A 0 * 
A ul 6 A 


El determinante de esta última ecuación es 
¡A — AI = (A; — AJ"[C — AIn-ml (A-42) 


Por otro lado. se tiene 


0 0 
rango (A — à; D) = 7 — m = rango fulo C- aale] 


0 0 
=rango| o Cat, | 710080 (CA lnn) 


Por lo tanto, se concluye que el rango de C —À, Í,_,, es n — m. En consecuencia 
|C — AL] 4 0 


y de la ecuación (A-42), A, se muestra ser el valor propio con multiplicidad m de ¡A — A Ij = 0. Ya que A; 
es el valor propio de A con multiplicidad k, se debe tener m = k. Por lo tanto, el rango de A— A, les n — k. 
Observe que, como el rango de A — A, Les n — k, la ecuación 


(A a Ài Dx, = 0 


tendrá k vectores propios linealmente independientes Xy, X2,..., Xp. 


Problema A-13 


Pruebe que los valores propios de una matriz Hermítica de n x n y de una matriz real simétrica de n x n 
son reales. Pruebe también que los valores propios de una matriz anti-Hermítica y de una matriz real anti- 
simétrica son cero o imaginarios puros. 


Solución Se define cualquier valor propio de una matriz llermítica A de n x n por À = a+ jB. Existe un 
vector x + 0 tal que 
Ax = (a + j¡B)x 

La transpuesta conjugada de esta última ecuación es 

x*A* = (a — jB)x* 
Ya que A es Hermitica A* = A. Por lo tanto, se obtiene 

xX*Ax = (a — ¡Bjx*x 
Por otro lado, como Ax = (a + B)x, se tiene 

x*Ax = (a + ¡B)x*x 
Por lo tanto, se obtiene 


[la — jp) — (a + ¡B)lx*x = 0 


—2jBx*x = 0 


Ya que x*x + 0 (para x + 0), se concluye que 
B=0 
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Esto prueba que cualquier valor propio de una matriz Hermítica A de n x n es real, De donde los valores 
propios de una matriz real simétrica son también reales, ya que es Hermítica. 

Para probar la segunda parte del problema, observe que si B es anti-Hermítica, entonces jB es 
Hermítica. Por lo tanto, los valores propios de jB son reales, lo que implica que los valores propios de B 
son ya sea cero o imaginarios puros. 

Los valores propios de una matriz real anti-simétrica son también ya sea cero o imaginarios puros, 
ya que una matriz real anti-simétrica es anti-Hermítica. 

Observe que, en la matriz real anti-simétrica, los valores propios imaginarios puros ocurren en 
pares conjugados, ya que los coeficientes de la ecuación característica son reales. Observe también que 
una matriz real anti-simétrica de n x n es singular si n es impar, ya que dicha matriz debe incluir al menos 
un valor propio cero. 


Problema A-14 


Examine si la siguiente matriz A de 3 x 3 es definida positiva o no: 


2 2 -1 
A=1| 26 0 
-1 0 1 


Solución Se demostrarán tres formas diferentes para probar la definición positiva de la matriz A. 


1. Primero se puede aplicar el criterio de Sylvester para la definición positiva de una forma cuadrática 
x” Ax. Para la matriz A dada, se tiene 


22 2 2 -1 
2>0, f 2| > 0, 2 6 0| >0 
-1 0 1 


Por lo tanto, los menores principales sucesivos son todos positivos. De esta manera, la matriz A es 
definida positiva. 
2. Se puede examinar la definición positiva de x” Ax. Como 


2 2 -1 Xi 
x” Ax == [x x2x3] 2 6 0 X2 
-1 0 1 || x2 


= 2x + 4x1x2 — 2x1 xs + 6x3 + x3 
= Qu = xy + (a + 2x2)? + 2x2 
se encuentra que x” Ax es positiva excepto en el origen (x = 0). Por lo tanto, se concluye que la 


matriz A es definida positiva. 
3. Se pueden examinar los valores propios de la matriz A. Observe que 


JAI — A] = A? — 94? + 152 — 2 
= (A — 2)(A — 0.1459)(A — 6.8541) 
Por lo tanto, 


À = 2, À2 = 0.1459, A = 6.8541 
Ya que los valores propios son positivos, se concluye que A es una matriz definida positiva. 


Problema A-15 


Examine si la siguiente matriz A es semidefinida positiva: 


1 2 1 
A=|2 4 2 
120 
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Solución En la prueba de definición positiva. se necesitan examinar los signos de todos los menores 
principales además del signo del determinante de la matriz dada. cl cual puede ser cero: es decir, [A] debe 
ser igual a 0. 

Para la matriz de 3 x 3 


Gu An An y 
da anz da 
da dz 43 
hay seis menores principales: 
du Ar 
a23 Az 


ada A 
a31 3 


a dz 


dí, an, 433, da as 


, > 




















Se necesitan examinar los signos de todos los seis menores principales y el signo de IA]. 
Para la matriz A dada. 











ai=1>0 
d.=4>0 
dia = 0 
an an| _ 1 2 =0 
dan dx 2 4 
da 42 4 2 
E = = -— < 
ar a33 2 0 TSN 
Ain i3 1 1 
a == = = XL 
da 33 1 0 l 0 
Au An i 1 2 1 
da a an| = |2 4 2¡=0 
da da da 120 





Es claro que, dos menores principales son negativos. Así, sé concluye que la matriz A no es semidefinida 
positiva. 

Es importante observar que, como se han probado los signos de los menores sucesivos y del 
determinante de la matriz A, 


12 121 
1>0, E 20, aj=|2 4 21=0 
120 


se pudo haber llegado a la conclusión errónea de que la matriz A es semidefinida positiva. 
De hecho, para la matriz A dada, 
Ay =2 +1 
-2 4-4 -2|=(A-— 54 — 5)A 
=1 -2 A 
(A — 5.8541)A(A + 0.8541) 


AI A] 


fi 


y los valores propios son 
ài = 5.8541, A2 = 0, Aj = —0.8541 


Para que la matriz A sea semidefinida positiva, todos los valores propios deben ser no negativos y al 
menos uno de ellos debe ser cero. Sin duda, la matriz A es una matriz indefinida. 
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Apéndice B 


| Teoría de la 
transformada z 

















B-1 INTRODUCCIÓN 


En este apéndice se presenta primero teoremas útiles de la teoría de la transformada z que no se 
trataron en el capítulo 2. Después se discuten detalles del método de la integral de inversión para 
encontrar la transformada inversa z. Por último, se estudia el método de la transformada z modifica- 
da. Al final del apéndice (en la sección de los problemas de ejemplo y soluciones), se discuten 
algunos problemas interesantes que tratan con la transformación z, que no se vieron en el capítulo 2. 


B-2 TEOREMAS ÚTILES DE LA TEORÍA DELA TRANSFORMADA z 
Aquí se presentan algunos de los teoremas útiles de la teoría de la transformada z. 


Diferenciación compleja. Una serie de potencias en z se puede diferenciar con respecto a z 
en su región de convergencia cualquier número de veces para obtener una serie convergente. Las 
derivadas de X(z) convergen en la misma región de X(2). 

Considere 


X(2) = 5 x(k)z* 


que converge en una cierta región en el plano z. Al diferenciar a X(2) con respecto a z, se obtiene 


Lx) E 


681 
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Al multiplicar ambos lados de esta última ecuación por —z se tiene 


-z4 X(2) = Y kx(k)z* (B-1) 
z k=0 
Por lo tanto, se tiene 

Z[kx(k)] = -z4 X(2) (B-2) 


De forma similar, al diferenciar ambos lados de la ecuación (B-1) con respecto a z, se tiene 


O) = È IA 


Al multiplicar ambos lados de esta última ecuación por ~-z, se obtiene 
d 


300) = Dex 


dX 
zes = (-2 E) 
[ex] = (23) X0 
2 
La operación (-z < ) implica que se puede aplicar el operador -4 dos veces. De igual manera, al 


repetir el proceso se tiene 
d m 
Z[k”"x(k)] = (E) X(z) (B-3) 
Dicha diferenciación compleja permite obtener nuevos pares de transformada z a partir de los pares ya 
conocidos. 
Ejemplo B-1 
La transformada z de la secuencia escalón unitario 1(k) está dada por 


Zi =325+ 


Obtenga la transformada z de la secuencia rampa unitaria x(k), donde 
x(k) = k 
mediante el uso del teorema de diferenciación compleja. 


z`} 


d 1 
Z{[x(k)] = Z1k] = Z[k - Uk)] = +25) “Y 
Integración compleja. Considere la secuencia 
x(k) 
glk) ==5 


donde x(4)/k es finita para k = 0. La transformada z de x(A)/k está dada por 
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0] 40 4, + lim mt (B4) 


z 


donde -[x()] = X(2). 
Para probar la ecuación (B-4), observe que 


e H0]- 60) - 50, 


k=0 
Al diferenciar esta última ecuación con respecto a z se tiene 


—G() = -5 x(k)z = =="! Š (oz =- 
k=0 k=0 


Al integrar ambos lados de está última ecuación con respecto a z desde z a x da 


A) 
z 


[coa = 6 - 6) = "Peas, 


G(z) = | a + G(o) 


Al observar que G(x) está dado por 


G(=) = limG(2) = g(0) = tim 


se tiene 
x(k X(z x(k 
20]. |. LED qa, + limž® 
k ko k 
Teorema de diferenciación parcial. e una función x(/, a) o x(kT, a) que tiene trans- 


formada z. Aquí a es una constante o una variable independiente. La transformada z de x(t, a) o (AT, 
a) se define como X(z, a). Por lo tanto, 


Z[x(t,a)] = Z[x(kT,a)} = X(z,a) 


La transformada z de la derivada parcial de x(z, a) o x(kT, a) con respecto a a está dada por 


a? x(t, a| - 2 Zxar, a)| = Ż x, a) (B-5) 


Esta ecuación se denomina el teorema de diferenciación parcial. 
Para probar este teorema, observe que 


æ 


z|Żxt,a)] = 2 2xar,0)| = AUT 


ð 
= kT, =k = — a 
23x a)z qa a) 
Ejemplo B-2 
Considere 


x(t,a) = t e“ 
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Obtenga la transformada z de esta función x(1, a) mediante el empleo del teorema de diferenciación parcial. 
Al observar que 


Ze te 7”) me, Pe -at 


2 Te Tz! 
a ETE 


Entonces se tiene 


Z[x(t,a)] = Z [te] =2[ Zi] 


EE E Cia 
ða) (1 -ez 
oTe + ez z 

a Ed eT zm 


Teorema de convolución real. Considere las funciones x,(/) y x,(t), donde 


x(0=0, parat<0 
x(0) =0, para/<0 


Suponga que x,(1) y x,(1) tienen transformada z y que son X (2) y X(2), respectivamente. Entonces 
k 
X (z)X(z) = z| 5 x(hT)x{kT — aD] (B-6) 
h=0 


Esta ecuación se denomina el teorema de convolución real. 
Para probar este teorema, observe que 


z| 2 x(AT)Ix(kT — in|- E 2 x(hT) KT — hT)z™ 


2 xilh T)x(kT — hT)z™ 


TMe RA 
¡Ms i M> 


donde se emplea la condición que x,(kT — AT) = 0 para h > k. Ahora se define a m = k — h. Entonces 


» w 


k 
z| 2 x(hT)x(kT — ar) = 2 xa(aT)* Y x (mT) 


Ya que x,(mT) = 0 para m < 0, esta última ecuación se convierte en 


z| 2 xı(hT)x{kT — ar)| = Dar)" y xAmT)2"" = X (DA) 


Teorema de la convolución compleja. El siguiente teorema, conocido como el teorema de la 
convolución compleja, sirve para obtener la transformada z del producto de dos secuencias x(k} y 


x(k). 
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Suponga que tanto x,(k) como x.(A) son cero para k < 0. También suponga que 
Xi(2) = Zk], ll >Ri 


X2) =Z [20], |z| >R: 


donde R, y R. son los radios de convergencia para x,(k) y x(k), respectivamente. Entonces la trans- 
formada - del producto de x,(k) y x(k) se puede escribir como 


ZEO] = Y OA DA B- 


donde R,<|¿<|=/R,. 
Para probar este teorema, se toma la transformada z de x, (k)x-(k): 


Z[x(k)x(k)] = DELOSO =k (B-8) 


La serie en el lado derecho de la ecuación (B-8) converge para |z| > R, donde R es el radio de conver- 
gencia absoluta para x,(k)xx(k). De la ecuación (2-23), se tiene 


x(k) = R GHE dz 


milyo - 
= PAD 89) 


Al sustituir la ecuación (B-9) en la ecuación (B-8), se obtiene 
1 < ? f 
Z palk] =$ XAO alk) ag 
T] g=07C 


Al observar que la ecuación (B-8) converge uniformemente para la región |z| > R, se puede intercambiar 
el orden de la sumatoria y la integración. Entonces 


ZAO] A E Ezag 
Ya que 
AMET Az) 
se tiene 
Zn] = $ ADE z) de (8-10) 


donde C es un contorno (un círculo con centro en el origen), que está en la región dada por |& > R, y 
12 z|> R0 


|z| 
R, < lg < R, (B-11) 


www.FreeLibros.me 


686 Teoría de la transformada z Apéndice B 
Teorema de Parseval. Suponga que las transformadas z de dos secuencias x,(k) y x(k) son 
Xe) = xH], Z> R, (donde R, <1) 
XE) = 2x] z> R, 
y la desigualdad (B-11) se satisface para |z| = 1, o 
Rı < |¢| < L 
R; 


Entonces, al sustituir |z| = 1 en la ecuación (8-10), se obtiene la siguiente ecuación: 


Za as = EJ) = ¿| ADA a 


Si se hace que x,(k) = x(k) = x(k) en esta última ecuación, se obtiene 


E) = ES XOXA 
= IIT XOXE dz (B-12) 


La ecuación (B-12) es el teorema de Parseval. Este teorema es útil para obtener la sumatoria de (A). 


B-3 TRANSFORMACIÓN INVERSA z Y EL MÉTODO DE LA INTEGRAL DE INVERSIÓN 


Si X(z) se expande en una serie de potencia en 7, 


X(z) = 2 x(kT)z~™* = x(0) + x(T)z! + x(2T)27? + +++ + x(kT)2* + 


» 


X(z) = 2027 = x(0) + x(1)27 + x(2)2? + -<> + x(k)2* + 


entonces los valores de x(kT) o x(k) dan la transformada inversa z. Si X(z) está dada en la forma de una 
función racional, la expansión en una serie infinita de potencias crecientes de z”* se puede lograr al 
dividir el numerador entre el denominador. Si la serie resultante es convergente, los coeficientes del 
término z™ en la serie son los valores de X(AT) de la secuencia de tiempo. Sin embargo, por lo regular 
es difícil obtener una expresión en forma cerrada. 

Algunas veces, las siguientes fórmulas son útiles para reconocer las expresiones en forma 
cerrada para series finitas e infinitas en z~". 


(1 - az"? = 1 — 3az™ + 3472?*-az>? 
(1 — az) = 1 — 4az* + 602? — 4a’ z™° + az~ 
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(1-a 3 = 1 + az™ + a@a?°z™°? + az + atz + az +. Iz] > 1 
(1 - az™)? = 1 + 2az™’ + 3427? 440024 5at2*+60425+-..,  lz]>1 


(1 — azi)? = 1 + 3az™' + 6a?°z™° + 10427? + 15a*z7* 


+21a 27% + 28072 +- lz| > 1 
(1 — az) *=1+4az* + 104777? + 204? 27? + 350*27* 
+ 56027 + 8B4a%2 + 120072" + --- Iz| > 1 


Para una transformada z X(z), si se desea la expresión en forma cerrada para x(k), se puede usar 
el método de la expansión en fracciones parciales o el método de la integral de inversión que se 
presenta a continuación. 


Método de la integral de inversión. El método de la integral de inversión, basado en la 
integral de inversión, es el método más común para obtener la transformada inversa z. Está basado en 
la teoría de variable compleja. (Para un presentación rigurosa y completa de la integral de inversión, 
refiérase a un libro sobre la teoría de variable compleja.) Al presentar la fórmula de la integral de 
inversión para la transformada z, se necesita revisar el teorema de los residuos y su material antece- 
dente asociado. 


Repaso del material necesario para obtener la fórmula de la integral de inversión. Suponga 
que z, es un punto singular aislado (polo) de F(z). Se puede ver que existe un número positivo r, tal 
que la función F(z) es analítica en cada punto z para el cual 0 < |z — zo| <r,. El círculo con centro z = zg 
y radio r, se denota como T`}. Se define a l, como cualquier círculo con centro en z = z, y radio |z — z/| 
=r, para el cual r, <r,. Los círculos I, y T, se muestran en la figura B-1. Entonces, la expansión en la 
serie de Laurent de F(z) alrededor del polo en z = z, puede estar dada por 


æ X b 
F(z) = 5 a(z — zo" + 2h 
( ) pa ( 0) 2 (z z= Zo)" 
donde los coeficientes a, y b, están dados por: 
El F(z) s 
An FA Tay n = 0,1,2,... 
zal F(z) 


"aj Ea n = 1,2,3,... 


Figura B-1 Región analítica para 
la función F(=). 
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Figura B-2 Región analítica para la 
función F(=) limitada por una curva 
cerrada T. 





Observe que el coeficiente b, está dado por 
Y $ 
b = Ia Aed (B-13) 


Se puede probar que el valor de la integral de la ecuación (B-13) no cambia si I`, se reemplaza por 
cualquier curva cerrada F alrededor de z, tal que F(z) sea analítica sobre y dentro de I` excepto en el 
polo z = z, (vea la figura B-2). La curva cerrada l puede extenderse afuera del círculo J. Entonces, en 
referencia al teorema de Cauchy-Goursat, se tiene 


$ F(2)dz — $ F(z)dz = 0 
r r 
Por lo tanto, la ecuación (B-13) se puede escribir como 
bi =>5 $ F(z)dz 
2) 21 
El coeficiente b, se denomina el residuo de F(z) en el polo zo. 


A continuación, se supone que la curva cerrada [encierra m polos aislados z,, Z3, ......, Zm, COMO 
se muestra en la figura B-3. Observe que la función F(z) es analítica en la región sombreada. De 





Figura B-3 Curva cerrada [f que 
encierra a m polos aislados Zi, Za.. a Zu 
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acuerdo al teorema de Cauchy-Goursat, la integral de F(z) sobre la región sombreada es cero. La 
integral sobre el total de la región sombreada es 


$ Fo) dz = $ F(z)dz -$ F(2) dz ~ — $ F(z)dz = 0 
r D Ty Tm 
donde F}, Pr..... Ison curvas cerradas alrededor de los polos z,, Z», . . . , Zm, respectivamente. Por lo 
tanto, 

$ F(2)dz =$ F(z) dz +$ F(z)dz +. +$ F(z) dz 

F Pi D Im 

= 2mj(bi, + bi, +e + b,,) 

donde K 5b, K5 bro... Ki, =b, son los residuos de F(z) en los polos z,. 23, . . . «Zm, respectivamente, 


La ecuación (B-14) se conoce como el teorema de los residuos. Este teorema establece que una 
función F(z) es analítica dentro y sobre una curva cerrada I’, excepto en un número finito de polos 
Zp Za, + +.» 2, dentro de T, entonces la integral de F(z) alrededor de P tomada en contra de las manecillas 
del reloj es igual a 277 veces la suma de los residuos de los polos 2), 27, ..., Zp 


Integral de inversión para la transformada z. Ahora se empleará el teorema de Cauchy- 
Goursat y el teorema de los residuos para obtener la integral de inversión para la transformada z. 
De la definición de la transformada z, se tiene 


æ 


X(2) = © x(kT)z™* = x(0) + x(T)2 "+ 2QT)2? + -+ + x(kT)z™* +- 


k=0 
Al multiplicar ambos lados de esta última ecuación por 747 ', se obtiene 
X= (092% + x(D)22 + x(2T)z ++ Mk T)Z2 > + (B-15) 


Observe que la ecuación (B-15) es la expansión en la serie de Laurent de X(=)27' alrededor del punto 
z=0. 

Considere un círculo C con centro en el origen tal que los polos de X(=)*7* están dentro de él. 
Al observar que el coeficiente de x(47) asociado con el término 7 en la ecuación (B-15) es el residuo, 
se obtiene 


x(kT) = XD de (B-16) 


La ecuación (B-16) es la integral de inversión para la transformada z. La evaluación de la integral de 
inversión se puede hacer como se presenta a continuación. 
Se definen los polos de X(=)2*7' como z4, 2», ..., Zm. Ya que la curva cerrada C encierra los polos 


entonces con referencia a la ecuación (B-14) se tiene 


TE 


Xd = f X(2)2* dz + f X(z)z'dz +--+ $ X(2)2** dz 
C Ci C? Cm 


= 2mj(K; + K, +... + Km) (B-17) 


donde K,, K», . . . , K„ denotan los residuos de X(=)27' en los polos Z4, Z», . . . , Zm, respectivamente, y 
Ca Co, ..., Cp son pequeñas curvas alrededor de los polos aislados z,, 2», - . ., Zm respectivamente. 
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Ahora se combinan la ecuaciones (B-16) y la (B-17) para obtener un resultado muy útil. Ya que 
XA | tiene m polos, esto es, Z}, 27, ..., Zp 
x(k) = xX(kT) = K+ Kitt Km 


= J [residuo de X(=)2*7' en el poloz = z,de X(=)z""] (B-18) 
(=1 
Al evaluar los residuos, observe que si el denominador de X(z)*"' contiene un polo simple en z =z, 
entonces el residuo K correspondiente es 


K = lim [(2 ~ z:)X(z)z'] 


Si X(0)47? contiene un polo múltiple en z, de orden q, el residuo K está dado por 
j P 


q-1 

Observe que en este libro se trata sólo con la transformada z unilateral. Esto implica que x(k) 
= ( para k <0. Por lo tanto, los valores de ken la ecuación (B-17) se restringen a los valores enteros 
no negativos. 

Si X(z) tiene un cero de orden r en el origen, entonces X(z)z*~ ' en la ecuación (B-17) involucrará 
un cero de orden r + k — 1 en el origen. Sir > 1 entonces r + k— 1 20 o k 20, y no existe un polo en 
z = 0 en X(2) ?. Sin embargo, si r < 0, entonces habrá un polo en z = 0 para uno o más valores no 
negativos de k. En tal caso, se necesita la inversión separada de la ecuación (B-17) para cada valor 
de K. 

Se debe observar que el método de la integral de inversión, cuando es evaluado por los resi- 
duos, es una técnica muy simple para obtener la transformada inversa z, considerando que X(z)2"' no 
tiene polos en el origen, z = 0. Si, sin embargo, X(2)2/7' tiene un polo simple o un polo múltiple en z = 
0, entonces los cálculos se pueden hacer engorrosos y el método de expansión en fracciones parciales 
puede ser más simple de aplicar. 


Comentarios sobre el cálculo de los residuos. Al obtener los residuos de una función X(2), 
observe que, sin importar la forma como se calculan dichos residuos, el resultado final es el mismo. 
Por lo tanto, se puede utilizar cualquier método que sea conveniente según la situación. Por ejemplo, 
considere la función X(z) siguiente: 


2z? + 5z +6 4z 5 

Z_” eee — + — 

AA A Er r 
Se demostrarán tres métodos para calcular los residuos de esta función X(2). 


Método 1. El residuo de esta función se puede obtener como la suma de los residuos de los 
términos respectivos: 


[Residuo K de X(z) al poloz =-1] 


e: 
6- 
5 


ta y sn ele Es y cm Tam [e rH | 
a. lim (4) + lim (4) + lim (5) = 2+4+5 
= 11 


2z? + 5z + s| 


lim 77 dle + 1) E +17 
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Método 2. Silos tres términos de X(z) se combinan en uno solo como se muestra a continua- 


ción, 
2z? + 5z +6 4z 5 _ 112z? +19z +11 
A EN +1. (+1) 


entonces el residuo se puede calcular como sigue: 


[Residuo K de X(z) al poloz =-—1] 


2 


1 „d 311z? + po] 
= —— — + A | 
em” Efe VGA 
= 3 lim (22) 
= 11 
Método 3. Si X(z) se expande en la forma usual en fracciones parciales como se muestra a 


continuación, 
112? + 19z + 11 3 3 11 
= — a  _ Á—_—____— - + — 
X) G + 1y G+} +i +1 


entonces el residuo de X(z) es el coeficiente del término 1/(z + 1). Por lo tanto, 
[Residuo K de X(z) al poloz=-—1]=11 
B-4 MÉTODO DELA TRANSFORMADA z MODIFICADA 


La transformada z modificada es una modificación del método de la transformada z. Se basa en insertar 
un retraso ficticio puro a la salida del sistema, además de insertar un muestreador ficticio en la salida, 
y variar la cantidad de retraso ficticio para obtener la salida entre cualquiera de dos instantes de 
muestreo consecutivos. 

El método de la transformada z modificada es útil no sólo para obtener la respuesta entre dos 
instantes de muestreo consecutivos, sino también para obtener la transformada z de procesos con 
retrasos puros o retrasos de transporte. Además, el método de la transformada z modificada se aplica 
a la mayoría de los esquemas de muestreo. 

Considere el sistema que se muestra en la figura B-4(a). En este sistema se inserta un retraso 
ficticio de (1 — m)T segundos, donde 0 < m < 1 y Tes el periodo de muestreo, en la salida del sistema. 
Al variar a m entre O y 1, se puede obtener la salida y(£) en 1 =kT-—(1—»m)T (donde k= 1,2,3,...). Al 
observar que G'(s) está dada por 


G*(s) = £[g(c)6r(1)] 


la función de transferencia pulso modificada G(z, m) se define como 
Zm[G(s)] = G(z,m) = G* (s, mls=wn Inz 
= Llg(t — (1 — m) TISH) mz (B-19) 


donde la notación .-,, significa la transformada z modificada. 
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X(s) Y Retraso 
5 (1- mT 
T 





Giz, m) ôr Yizım) 
(a) 
X Yiz, m) 
3 
(b) 
Figura B-4 (a) Sistema con retraso ficticio de (1 — m)7 segundos; (b) sistema con función de transferencia pulso 


modificada con entrada X(z) y salida Y(z. m). 


Al observar que 


Fig — (1 - m)T)ô(t)}] = Llg(t - T + mT)ór(t)] 


e`” Lg(t + mT)8r(c)) 


se tiene 

G*(s,m) = e" [g(t + mT)6,(0)] (B-20) 
Ya que Fe(t + mT)8/(0)] es la transformada de Laplace del producto de dos funciones en el tiempo, con 
referencia a la ecuación (3-19) se puede obtener como sigue: 


eT 


Blet + mD =>) Or ead (821) 


La integral en el lado derecho de la ecuación (B- i se puede llevar a cabo en forma similar a la 
discutida en la sección 3-3, es decir, la integral de convoiución se puede obtener al integrar ya sea en 
el semiplano izquierdo o en el semiplano derecho. 

Se considera que el contorno de integración está a lo largo de un semicírculo infinito en el 
semiplano izquierdo. Entones 


He(t + mT)8/(0) = $ residuo de SEE ea Z un polodeG(s)| (B-22) 


Por lo tanto, de las ecuaciones (B-19), (B-20) y (B-22), se obtiene la transformada z modificada de G(z) 
como sigue: 


Gle 2 


Gl, m)=z" s [residuo de CDE un polo de G(s) (B-23) 


Observe que la transformada z modificada G(z, m) y la transformada G(z) se pueden relacionar como 
sigue: 


G() = lim zG(z,m) (B-24) 
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Con referencia a la figura B-4(b), la salida Y(z, 1) se obtiene como sigue: 


Y(z,m) = G(z,m)X (2) (B-25) 


Como en el caso de la transformada z, la transformada z modificada Y(z, m) se puede expandir en una 
serie infinita en 7*, como sigue: 


Y(2,m) = y(m)z™ + y (m)z 7? + y(m)z > +- (B-26) 


Al multiplicar ambos lados de la ecuación (B-26) por z, se tiene 


zY(z,m) = yam) + y(m)z™ + y(m)z™? +- (B-27) 


donde y,(m) representa el valor de y(t) entret =kTyt=(k+1)T(k=0,1,2,...)0 
y(m) = y((k + m)T) (B-28) 


Observe que si y(k) es continua entonces 


lim Yi (m) = lim y.(m) (B-29) 


La parte izquierda de la ecuación (B-29) da los valores y(0—), y(T-), YT), . . . , y el lado derecho da los 
valores y(0+), y(T+), y(2 T+), . . . Si la salida y(kT) es continua, entonces (AT) =MAT+). 


Ejemplo B-3 
Obtenga la transformada z modificada de G(s), donde 


G(s) = 





s+a 
Con referencia a la ecuación (B-23), se obtiene la transformada z modificada de G(s) como 





less 1 e”"”z 
G(z,m) =2Z residuo de z pmpolodes = -q 








s+az- 
i a 1 e””z 
=z lim |(s +a) = 
s-a s+az-e” 
2 E emTa Ml g maT ¿1 
=z z-e% ] ez" 


Ejemplo B-4 


Considere el sistema que se muestra en la figura B-5(a) y (b). Obtenga la salida ¥(z, 11) de cada sistema. 
Para el sistema que se muestra en la figura B-5(a), se obtiene 


Y(2,m) =Z m[Y(s)] = GAz,m)G(2)X(2) 
Observe que 
Y(2) =Z[Y(s)] = GA2)G(2)X(2) 


Para el sistema que se muestra en la figura B-S(b), se tiene 


Y(z,m) = Z n[Y(s)] = Gi G(z,m)X (z) 
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Xis) Æ Xis) Ys) 
G,1s) 
ôr Xiz) ôr 


ôr Yiz, m) 


(a) 





—_— 
ôr Yíz, m) 


(b) 


Figura B-5 (a) Sistema con un muestreador entre G,(s) y G(s), (b) sistema sin muestreador entre G(s) y G(s). 


donde 


G,GaAz,m) = Z m[G:(s)}G2(s)}] 
Observe que 


Y(2) = G, Ga(z)X (2) 
Ejemplo B-5 


Considere el sistema que se muestra en la figura B-6. Obtenga la transformada z modificada de C(s). 
La salida C(z) está dada por 

G(z 

Cl2) (2) 


=F GHG O 


La transformada z modificada de C(z) está dada por 


G(z,m) 
1 + GH(2) 


C(z,m) = R(z) (B-30) 





Figura B-6 Sistema de control de lazo cerrado. 
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Ejemplo B-6 
Considere el sistema que se muestra en la figura B-7. El periodo de muestreo F es de 1 segundo, o T= 1. 
Suponga que el sistema está sujeto a una entrada escalón unitario. Obtenga c,(m) para m=0.5 y k=0, 1, 
2,....9. También. verifique que la ecuación (B-24) se conserva cierta. La transformada z modificada de 
G(s) se obtiene de la ecuación (B-23) como sigue: 


s A no G(s)e™z 3 
Glz, m)= 7'5 | residuo de 226 en polo de G(s) 








f 
= r'(-=z 2% rosituode r 5 =- doble polo en s= o 


=> 


1 e”"z | 


7 un simple polo s=- al 








f 
Eiss 
¡residuo de TEE 


araea Eo adkae eT 
B la Im e] 


, 1 e™z 
T GE Tj 
agp _ -nmz -mz -z +22 enz 
=z (1-z kecu +5] 
(m-1Dz2*+(Q-mz*?* e”z (1-2) 
O 


Irez 
(m — 1+e"")2"" + (2.3679 — 1.3679m — 2e™™)z™? 


y + [-0.3679(2 — m) + e””]z > 


p (1 - z7')(1 — 0.3679z~') 








Con referencia a la ecuación (B-30) y al notar que R(=) = 1/(1 — 57), se tiene 
G(2,m) 1 
eem ETE i-z 


(m — 1 + e™™)z! + (2.3679 — 1.3679m -— 2e"")z7? 
+ (—0.7358 + 0.3679m + e ")z? 
1-22 + 1.63212? — 0.6321z ? 





Por lo tanto, para m = 5 se tiene 


0. 10652 + 0.47092? + 0.05468z >? 
- 22 * + 1.63212? — 0.632127* 


C(z,0.5) = (B-31) 






ôr 
Ciz, m = 8m [c,(m)) 


Figura B-7 Sistema de control de lazo cerrado. 
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Con referencia a la ecuación (B-27), la ecuación (B-3 1) se puede expandir en una serie infinita en z! como 
sigue: 


C(z,0,5) = co(0.5)27* + c,(0.5)27? + c0.S)z* +++. 


2C(2,0.5) = co(0.5) + c1(0.5)z"* + c2(0.5)27? + --- 


donde c(0.5) = c((k + 0.5)7) = c(k + 0.5) y k= 0, 1,2,... Los valores de c,(0.5) se pueden obtener 
fácilmente con una computadora digital. La solución por computadora parak=0, 1,2, ...,9 es como sigue: 
co(0.5) = c(0.5) = 0.1065 


ci(0.5) = c(1.5) = 0.6839 
c2(0.5) = c(2.5) = 1.2487 
ca(0.5) = c(3.5) = 1.4485 
ca(0.5) = c(4.5) = 1.2913 
cs(0.5) = c(S.5) = 1.0078 
ce(0.5) = c(6.5) = 0.8236 
cx(0.5) = c(7.5) = 0.8187 
cs(0.5) = c(8.5) = 0.9302 


co(0.5) = c(9.5) = 1.0447 
Estos valores dan la respuesta de los puntos medios entre pares consecutivos de puntos de muestreo. 
Observe que al variar el valor de / entre O y | es posible encontrar la respuesta en cualquier punto entre 
dos puntos de muestreo consecutivos, como c(1.2) y c(2.8). 
Finalmente, observe que 


. _>|l-e” 1 
Gte) =Z16(01=2| A zn 


o (T-1+e "jz '+(1~-e7- Teji? 
E (M1-z25D0-e*z>) 
Ss 0.3679z' + 0.2642z ? 

A -z DU -0.36792 *) 








y 
i _ 0.367927! + 0.2642z ? 
im Gem) NS AS 
Por lo tanto, 


G(2) = lim zG(z,m) 
m—0 
Es claro que la ecuación (B-24) se conserva cierta. 


Resumen. El propósito principal de esta sección ha sido presentar el método de la transforma- 


da z modificada para encontrar la respuesta en cualquier tiempo entre dos instantes de muestreo 
consecutivos. Se observa que la transformada z modificada se puede usar no sólo para este propósito, 
sino para tratar con esquemas de muestreo con múltiples frecuencias de muestreo. 
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PROBLEMAS DE EJEMPLO Y SOLUCIONES 


Problema B-! 


Obtenga la transformada z de 1/k! 


Solución 
1] Sl o, 
e] TAS 
1 
pe sig i= g yi -4 
=1+2z +31? +3? Hg? + 
=expíz"!) 
Problema B-2 
Obtenga 


(Esta serie se parece a la de la transformada z de 1/k, pero la secuencia k comienza aquí con 1 en lugar de 0.) 


Solución Ya que 











= E = 1 
Ditel+z2 +z? += =,  lj>1 
k=0 l-z 
al multiplicar ambos lados de esta última ecuación por 77, se tiene 
0 -2 
-k-2 __Z 
> z = =1 
k=0 LSZ 
Al integrar esta última ecuación con respecto a z. se tiene 
2 -2 
=k- z 
|2: ü a = [az 
k=0 2 
O 
S g! 
y = ]n(1 — z7*) + constante (B-32) 
k=0 =k - 1 


donde la constante en la ecuación (B-32) es cero, [Para verificar esto, sustituya z por en ambos lados de 
la ecuación (B-32).] Por lo tanto, la ecuación (B-32) se puede reescribir como sigue: 


2 


k=1 


æ 


g* 
Zgb- l> 


y (G =-In(1=2"  kzļ|>1 
k=1 


Problema B-3 


La primera diferencia hacia atrás entre x(k) y x(k — 1) se define como 


Vx(k) = x(k) — x(k — 1) 
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La segunda diferencia hacia atrás se define como 
V?x(k) = V[Vx(k)] = V[x(k) — x(k — 1)] 
= Vx(k) — Vx(k — 1) 
y la tercera diferencia hacia atrás se define como 
Vx(k) = V x(k) - Vx(k - 1) 
De forma similar. la m-ésima diferencia hacia atrás se define como 
V” x(k) = VU x(k) — 0 x(k - 1) 

Obtenga la transformada z de Vx(k), V? x(k), V° x(k), y V” x(k). 


Solución La transformada z de la primera diferencia hacia atrás se obtiene como sigue: 


Z[Vx(k)] =2 [x(x)] -Zik - 0) 


= X(2) - 7 'X(2) 
= (1-27 X(2) (B-33) 
Como 
V? x(k) = [x(k) — x(k — 1)] ~ [x(k — 1) — x(k — 2)] 
= x(k) ~ 2x(k — 1) + x(k - 2) 
la transformada z de V? x(k) es 
ZIV?x(k)] = Z[x(k)] -2 Z[x(k — 1)] + Z [x(k - 2)] 
= X(z) - 22 X(z) + z? X(2) 
= (1 -2`F X(z) (B-34) 
En esta forma se obtiene 
Z[V*x(k)] = (1 - 2 Xe) 
Observe que la operación de tomar la diferencia hacia atrás corresponde a multiplicar X(=) por (1 —2*). Por 
lo tanto, para la m-ésima diferencia hacia atrás 
V"x(k) = UV" xk) — O" x(k - 1) 
se tiene 
Z[V”"x(k)] = (1 - 2)” X(2) (B-35) 


Problema B-4 
La primera diferencia hacia adelante entre x(k + 1) y x(k) se define como 
Ax(k) = x(k + 1) ~ x(k) 
La segunda diferencia hacia adelante se define como 
A x(k) = A[Ax(k)] = Aflx(k + 1) ~ x(k)] 
= Ax(k + 1) — Ax(k) 
La tercera diferencia hacia adelante se define como 


A x(k) = Ax(k + 1) — 4? x(k) 
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y la m-ésima diferencia hacia adelante está dada por 
A” x(k) = A" x(k +1) - 477" x(k) 
Obtenga la transformada z de Ax(k). A“ x(k). A% x(k). y A” x(k). 
Solución La transformada - de la primera diferencia hacia adelante está dada por 
Z[4x(x)] = Z[x(k + 1] -Z [x(k)] 
= 2X(2) — zx(0) - X(2) 
(z = 1)X(2) — zx(0) (B-36) 


Ya que 
A? x(k) = [x(k + 2) — x(k + 1)] - [x(k + 1) — x(k)] 
x(k + 2) — 2x(k + 1) + x(k) 


la transformada z de A` x(k) es 
Z[4x(k)] = Zl[x(k + 2) — 2x(k + 1) + x(k)] 


z? X(z) — z°x(0) — zx(1) — 2[2X (2) — zx(0)] + X(2) 
(z - 1) X(2) — z(z — 1)x(0) - z 4x(0) (B-37) 


H 


lj] 


donde Ax(0) = x(1) — x(0). La transformada z de A* x(k) se convierte en 
Z[4*x(k)] =Z [x(k + 3) — 3x(k + 2) + 3x(k + 1) — x(k)] 
= (2 — 1) X(2) - z2(2 — 1} x(0) — z(z — 1)4x(0) - z 4? x(0) 
donde Ax(0)=x(1)—x(0) y A? x(0)=(2) -2x(1) + x(0). De forma similar. para la m-ésima diferencia hacia 
adelante 
A” x(k) = 47" x(k +1) - 47 x(k) 
se tiene 
m-i 
Z[á" x(k] = (z - D” X(z)-z: 5% (z = 1977 A x(0) (B-38) 
1=0 
Problema B-5 
Resuelva la siguiente ecuación en diferencias: 
(k + 1)x(k + 1) — x(k) =0 
donde x(k) = 0 para k<0 y x(0)= 1. Observe que la ecuación en diferencias es de la clase variante en el 
tiempo. La solución de este tipo de ecuación en diferencia se puede obtener mediante el empleo de la 
transformada z. (Se debe tener cuidado ya que el enfoque de la trasformada z aplicada a la solución de 
ecuaciones en diferencia variantes en el tiempo puede no ser exitosa.) 


Solución Primero, observe que 
“tw 5) 
E dz 


ya que la ecuación en diferencias original se puede escribir como 


Wa PEITOS me AÑ 
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la transformada z de esta última ecuación se puede obtener como sigue: 


-z£ xQ) -z` X(z)=0 


d 
2= = 
z q A) + Xz) 0 
de donde se tiene 
dX(z) ña _dz 
X(z) z? 


InX(2) =} +InK 


donde K es una constante. Entonces X(z) se puede encontrar de 


X(z) = Kexpz 
Como exp z* se puede expandir en la serie 
El - I z T 
expz™ = ltz + tae, Iz|>0 
se tiene 
X(z) = K|1 o T 
2! 31 

de la cual se encuentra que la transformada inversa z de X(z) es 

1 

x(k) = KẸ» k=0,1,2,... 

Como x(0) está dada como 1, se tiene 

x(0=K=1 


De donde, se ha determinado la constante desconocida K. Por lo tanto, la solución para la ecuación en 
diferencias dada es 
1 


x(k) = 75> =0,1,2,... 
Problema B-6 
Resuelva la siguiente ecuación en diferencias 
(k + D)x(k + 1) — kx(k) = k + 1 
donde x(k} = 0 para k < 0. 
Solución Primero observe que al sustituir k= 0 en la ecuación en diferencias dada, se tiene 


x(1) = 1 
Ahora se define 


y(k) = kx(k) 
www.FreeLibros.me 


NA 
oe 


Agendice l ITOC/EMAS TE E SO(UCIONES 
cocer m 11O0DIDINOD OD O RS IMODE? 


CONOS ARLANICIÓN en diierentias se puede escribir como 


AI 
$ i 
2Y(2) = (0) - Y(2) = q —— + er 
Como y(0) = 0, se tiene 
q? qa 


Ye) =g Iry = y a E -z7 


Con referencia al problema A-2-8. se tiene 


-2 

>-1 z olg 

i hih z` ] e: 
Entonces. la transformada inversa z de Y(=) puede estar dada por 

y(k) = KK" — k) + k =H1 +k) 
Entones, x(k} para k= 1, 2,3... . se determina de 
kx(k) = y(k) = H(k? + k) 

como sigue: 


x(k) =}(k +1)  k=1,2,3,... 


Problema B-7 


Considere el sistema que se muestra en la figura B-8. El periodo de muestreo es de 2 segundos, o T= 2. La 
entrada x(+) es una función delta de Kronecker 8,(£); es decir, 


LñL k=0 
THR k#0 


Obtenga la respuesta cada 0.5 segundos mediante el empleo del método de la transformada z modificada. 
Solución Como la entrada x(1) es una función delta de Kronecker, se tiene 

X(2) = 1 
La función de transferencia pulso modificada G(=, m1) se obtiene como sigue. Con referencia a la ecuación 
(B-23). 


MIS a 


Ki 
Gl Em= 2” [residuo da £ AE un polo s =- 0.693 ] 





Al observar que 7'= 2, se obtiene 


1 ez 
G m = =1 m E a AN 
GAN (im, [e A las aj 


K ¿2 (07138627 z E 4” 


z— e72 z — 0.25 
pa 
s + 0,6931 


Gis) 






x) A y(t) 
ô 
" Figura B-8 Sistema muestreado. 





o 
ôr  Yíz,m) 
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Entonces la ecuación en diferencias se puede escribir como 
y(k+1)-y(k)=k+1 


Al tomar la transformada z de esta última ecuación. se tiene 


zY(z) — zy(0) — Y(z) = ay “A 


Como y(0) = 0, se tiene 


A -rF 


Con referencia al problema A-2-8. se tiene 


Entonces. la transformada inversa z de *(-) ud estar dada por 
y(k) = 40 — k) + k =J(k" + k) 
Entones, x(k) para k = 1, 2, 3... . se determina de 
kx(k) = y(k) = H(k” + k) 
como sigue: 


x(k) =Ł4(k +1),  k=1,2,3,... 


Problema B-7 


Considere el sistema que se muestra en la figura B-8. El periodo de muestreo es de 2 segundos, o T=2. La 
entrada x(1) es una función delta de Kronecker 9,(£): es decir, 


1 k=0 
ado = (y k+0 


Obtenga la respuesta cada 0.5 segundos mediante el empleo del método de la transformada z modificada. 


Solución Como la entrada x(£) es una función delta de Kronecker, se tiene 


X(2) =1 
La función de transferencia pulso modificada G(z, m) se obtiene como sigue. Con referencia a la ecuación 
(B-23). 


mis 


G(z, m) = = [residuo de 0591 A 





77 un pol los=06931 


Al observar que T = 2, se obtiene 





G(2,m)=2""% lim |(s+0 6931) === Ca 
E s—» —0.6931 : s+ 0.6931 RER e” 

e z (e719862y" z z 47 

ze 1% 272-025 
x(t) A 1 yit) 
$ s + 0.6931 
A Figura B-8 Sistema muestreado. 
Gís) —————_ po 
ôr Yiz, m) 
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Por lo tanto, la salida Y(z, m) se puede obtener como sigue: 
4” 


Y(z,m) = G(2,mX(z) = z- 025 


Con referencia a la ecuación (B-27), se tiene 
zY(z,m) = ym) + y (mj)z"* + y{m)z™? +» 


donde y (m) =y((k+ m)T)=y(2k+ 2m). En este problema z ¥(z, m) se puede expandir en una serie infinita 
en 7? como sigue: 


4” 
20M) == 02527 


= 4 me 












Por lo tanto, ? M 
ym) = 4" 
yim) = 4 
ym) = 4"? 
ym) = 4" 
Para obtener la salida del sistema cada 0.5 segundos, se hace que m = 0, 0.25, 0.5 y 0.75. Para m = 0.25, se 
obtiene 
yo(0.25) = y(0.5) = 4° = 0.7071 
y:(0.25) = y(2.5) = 4 '” = 0.1768 
yA0.25) = y(4.5) = 47>% = 0.04419 
y3(0.25) = y(6.5) = 4 *% = 0.01105 
yim) 


y, (m) = yllik + mT) = y(2k + 2m) 


1.0 eo m=0 
W m=0.25 
0.8 A m=0.50 
2 o m=0.75 


0.6 
0.4 


0.2 


t (segundos) 


0 1 2 3 4 k 


Figura B-9 Gráfica de y¿(m) contra k para el sistema considerado en el problema B-7. 
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De forma similar, se pueden calcular los valores de y,(m) para m = 0, 0.5, y 0.75. Este resultado se 
muestra en la figura B-9 como una gráfica de y,(m) contra A. 


Problema B-8 


Obtenga C(=, m), la transformada z modificada de la salida, del sistema que se muestra en la figura B-10. 





Figura B-10 Sistema de control de tiempo discreto en lazo cerrado. 


Solución De la figura B-10 se tiene 
E(s) = R(s) — C(s) 
M(s) = Gs) E*(s) 
C(s) = GAs)M*(s) 


Por ło tanto, 

M* (s) = G? (s)E* (s) 
o 

M(2) = Gi(z)E(z) 
También, 

E*(s) = R* (s) — C*(s) = R*(s) — G3(s)M* (s) 
E(z) = R(z) - G(2)M(2) 

Por lo tanto, 


M(z) = Gi(z)[R(z) - G:(2)M(2)] 


de la que se obtiene 
Gi(zJR(2) 


MA G:(z)G:(2) 


Como C(z, m) se puede dar como G (z, mjAf(=). se tiene 


G¡(2)GAz,m) 


C(z,m) = GA(z,m)M() = 1+ G(GAZ) R(z) 
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Apéndice C 


Diseño por ubicación de 
polos cuando la señal de 
control es un vector 


C-1 INTRODUCCIÓN 


En el capítulo 6'se presentó la técnica de ubicación de polos y el diseño del observador del estado 
cuando la señal de control u(k) era un escalar. Sin embargo, si la señal de control es una cantidad 
vectorial (vector-r), se puede esperar una mejoría en la respuesta característica del sistema porque se 
tiene más libertad para elegir las señales de control u,(k), u,(A), . . ., u,(k). Por ejemplo, en el caso de 
un sistema de orden n con un control escalar, la respuesta de oscilaciones muertas (deadbeat) se 
puede alcanzar cuando más en n periodos de muestreo. En el caso del control vectorial u(X), la 
respuesta de oscilaciones muertas se puede alcanzar en menos de n periodos de muestreo. 

Se observa que con el control vectorial es posible escoger en forma libre más de n parámetros; 
es decir, además de ser capaz de ubicar n polos de lazo cerrado en forma adecuada, se tiene la 
libertad de satisfacer otros requerimientos, si existen, para el sistema en lazo cerrado. 

Sin embargo, en este caso del control vectorial, el cálculo de la matriz de retroalimentación del 
estado K se vuelve más compleja, como se verá en este apéndice. 


C-2 DISCUSIÓN PRELIMINAR 


Considere el sistema 


x(k + 1) = Gx(k) + Hu(k) (C-1) 
donde 
x(k) = vector de estado (vector-n) en el instante de muestreo k 
u(k) = vector de control (vector-r) en el instante de muestreo k 
G = matriz de n X n 
H = matriz de n X r 
704 
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Se supone que las magnitudes de los r componentes de u(k) están restringidos. Como en el caso del 
sistema con señal de control escalar, se puede probar que una condición necesaria y suficiente para 
ubicar polos en forma arbitraria para el sistema definido por la ecuación (C-1) es que el sistema sea 
completamente controlable. 

Se supone que el sistema definido por la ecuación (C-1) es completamente controlable. En el 
esquema de retroalimentación del estado, el vector de control u(k) se escoge como 


u(k) = -Kx(k) (C-2) 


donde K es la matriz de ganancia de retroalimentación del estado, que es una matriz de r X n. 
Con la retroalimentación del estado el sistema se vuelve un sistema de lazo cerrado y su ecuación 
de estado se convierte 


x(k + 1) = (G — HK)x(k) 


donde la matriz K se escoge para que los valores propios de G — HK sean los polos de lazo 
cerrado deseados U, Ha, ... > My» 


Transformación de la ecuación de estado a la forma canónica controlable. Considere 
el sistema definido por 


x(k + 1) = Gx(k) + H,¡u(k) (C-3) 
donde 
x(k) = vector de estado (vector-n) 
u(k) = señal de control (escalar) 
G = matriz de n X n 
H, = matriz de n X 1 


Suponga que el sistema es completamente controlable. Entonces la matriz de controlabilidad 
tiene inversa. Se define 


donde los f, son los vectores renglón. Entonces se construye una matriz de transformación T, 
como sigue: 


fno T 
T, = o (C-4) 
f, G! 
donde los f, G* son los vectores renglón (k = 0, 1,2,...,»— 1). Entonces se puede mostrar que 
fn Ele 
T GT, = as G LG 
Gr] [nG 
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0 1 0 0 
0 0 1 0 
AE T E (C-5) 
y An ân- An-2 41 
0 
0 
T `H =|: (C-6) 
0 
1 


[Vea el problema C-1 para obtener las ecuaciones (C-5) y (C-6).] 
Ahora se define 


x(k) = T,X(k) 


entonces la ecuación (C-3) se convierte en 
X(k + 1) = TI GT, (k) + T¡'H,u(k) 


O 
Í(k+1) | 10 1 0 +++ 0 || %(k) 0 
lk +1) 0 0 1 = 0 | %(k) 0 
l =| : : f : + |: ju(k) (C-7) 
„i(k + 1) 0 0 0 + 1 ||%,,(k) 0 
Xn(k T 1) Tårn, anr- Tar,-2 tt 41 Xn(k) 1 


Por lo tanto, se tiene que la ecuación de estado, ecuación (C-3), se puede transformar en la forma 
canónica controlable mediante el empleo de la matriz de transformación T, definida por la ecuación 
(C-4). 


Pasos de diseño. A continuación se discutirá el procedimiento para determinar la matriz de 
ganancia de retroalimentación del estado K tal que los valores propios de G — HK estén en los 
valores deseados Hi, Uz, <.. , Up 

La ecuación de estado que se considera a continuación es la dada por la ecuación (C-1): 


x(k + 1) = Gx(k) + Hu(k) 


Se supone que el rango de la matriz H de n X r es r. Esta última ecuación es equivalente a 


donde 
hii 


(H,:H):>--:H,] =H, H; = ha R i= 1,2,...,r 
Ani 
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El procedimiento para diseñar la matriz de ganancia de retroalimentación del estado K involucra los 
siguientes pasos: 


Paso 1. Extienda el proceso de transformación [el proceso que transforma la ecuación de 
estado dada por la ecuación (C-3) en la ecuación de estado en la forma canónica controlable dada por 
la ecuación (C-7)] al caso donde la matriz H es una matriz de n X r Es decir, la ecuación de estado 
dada se transforma en la forma canónica controlable mediante el empleo de la matriz de transforma- 
ción T, cuya forma exacta se dará posteriormente. Se define 


x(k) = TX(k) 
la ecuación de estado original, ecuación (C-1), se puede transformar a 
K(k + 1) = T GTR(k) + T Hu(k) = Gx(k) + Hu(k) (C-8) 
donde Ĝ = T" GT está en la forma canónica controlable y Ĥ =T`H. (Esta forma canónica contro- 


lable es ligeramente diferente a la forma usual, como se verá más adelante.) 


Paso 2. Mediante el uso de la matriz de ganancia de retroalimentación del estado K, el 
vector de control puede estar dado por 


u(k) = —Kx(k) = —-KTx(k) 
y la ecuación de estado del sistema se convierte en 
X(k + 1) = (Ĝ - HKT)(k) 
La matriz K se escoge para que la matriz Ĝ - ĤKT tenga los valores propios deseados H, Hy . .., 


Hn 


C-3 DISEÑO POR UBICACIÓN DE POLOS 


Primero se discutirá la forma como se determina la matriz de transformación T para después deter- 
minar la matriz de ganancia de retroalimentación del estado K. 
Considere el sistema completamente controlable definido por 


x(k + 1) = Gx(k) + Hu(k) (C-9) 
donde 
x(k) = vector de estado (vector-n) 
u(k) = vector de control (vector-r) 
G = matriz de n X n 
H=[H, : H,: + -+ | H,] = matriz de n X r 
Se supone que el rango de la matriz H es r. Por lo tanto, los vectores componentes H,, H,, . . . , H, de 


la matriz H son linealmente independientes, ya que el sistema se supone de estado completamente 
controlable, el rango de la matriz de controlabilidad de n X nr 
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es n. La matriz de controlabilidad se puede escribir en una forma expandida como sigue: 


Se seleccionan n vectores linealmente independientes de la matriz 1 X nr. Se comienza con el lado 
izquierdo de la matriz. Ya que los primeros r vectores H,, H,, . . . , H, son linealmente independien- 
tes, se seleccionan estos r primeros vectores. Si es así, que tenemos que -= 1 son vectores linealmente 
independientes. Entonces se examina GH, para ver si es linealmente independiente de los r vectores 
escogidos. A continuación se examina GH,, GH,,..., GH,, . . . en el orden que se muestra en la 
matriz de controlabilidad expandida hasta que se encuentren ~ vectores linealmente independientes. 
(Ya que el rango de la matriz de controlabilidad es n, siempre hay n vectores linealmente indepen- 
dientes.) 

Una vez que se seleccionan los n vectores linealmente independientes, se arreglan en la si- 
guiente forma 


GH, !---:H, GH,- +- iG” H] (C-10) 
El número n, se dice ser invariante de Kronecker y satisface la ecuación 
ntmt-- +n =n 
Se define el máximo de n, 1), . . . , N, COMO Min: 


Nmin = MAX (A4, A2, . . . , A) (C-11) 


Se hará referencia a esta ecuación en la discusión de la respuesta de oscilaciones muertas. A conti- 
nuación se calcula F” y se define el vector renglón n, como f, donde 


Nn =n tmt +N, ¿=1,2,...,r 


Entonces la matriz de transformación T requerida se puede dar como 
s, |" 
T=]. (C-12) 
donde S, 


S; TA HA 

f Gu 

Observe que la matriz de transformación T dada por la ecuación (C-12) es una extensión de la matriz 
de transformación dada por la ecuación (C-4). 

Para simplificar la presentación, ahora se considerará un caso simple donde n = 4 y r = 2. (En 
este caso, sólo n, y n, están involucradas.) (La extensión a casos más generales es directa.) Entonces 
la matriz de transformación T se convierte en una matriz de 4 X 4. La matriz de transformación T 
dada por la ecuación (C-12) se convierte en 


-1 
-|S 
r= [$ 
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donde 


fı f, 
S; E : > S, : 
f Gu! f Gr! 
(observe que en el caso de 1 = 4 existen tres posibilidades para las combinaciones n, y m: 2, = 1, m 
=3;n,=2,1n,= 2; ynm,= 3, m = 1. Por ejemplo, si n = 2 y n, = 2, entonces las matrices G y Ĥ se 
convierten, respectivamente, en 


0 1:0 0 
A = pogt = |78722743 TA |  sin=2,m=2 C-13 
G=T GT 6 ô to ib 1 2 ( ) 
| 
Ta Tan ltda ay 
y 
ia E o] sin =2,m=2 
H=T H i op (Nota: b =f, GH, = 0 en este caso) (C-14) 
0 1 


véase el problema C-2). Como otro ejemplo, si n, = 3 y n, = 1, entonces 


0 0 1 


G = T"GT= i sin =3,m=] C-1 
Zan Tan a | i SH 
Tän Tan ay | -any 
y 
0 0 
-T° H= 0 0 i dC (C-16) 
1 by (Nota: b = fi G7 H, puede o no ser cero) 


(vea el problema C-4). A continuación, se tratará el caso donde n, = 2 y m, = 2. (Otros casos se 
pueden manejar de forma similar. Por ejemplo, para el caso donde n, = 3 y m, = 1, véanse los proble- 
ma C-3, C-4 y C-5.) Para este caso donde n, = 2 y n, =2, la matriz G = T' GT puede estar dada por 
la ecuación (C-13) y la ecuación característica es 


























z -1 0 0 
|zl E rel m a z an jos G 
az an da Z + Qda 
|z -1 z -1 z —lila3 ayu 
anu Z + anllan Z +t anų adi anilz —1 
= (z? + az + 412? + auz + aa) — (anz + an)ajz + a13) 


(C-17) 
=0 
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donde se ha utilizado la expansión de Laplace en menores. (Véase el apéndice A para los detalles.) 
De la ecuación (C-17) la ecuación característica [zl — G | = 0 se convierte en 


a zZ + apz +a! 
Izl — G| = a E A 


; =0 (C-18) 
AyZ + an 1z2 + ayz + ay 





Los valores propios de G se pueden determinar al resolver la ecuación característica. 
A continuación, se determinará la matriz de ganancia de retroalimentación K para que los 
valores propios de G — HK sean 1, fa, . . . , Hn Se define la matriz B de 2 X 2 tal que 


_ [1 br] 
s=[o %] 


(Observe que b,, es una constante que aparece en la matriz ù .) En el caso particular donde n, = 2 y 
n, = 2, el valor de b,, es igual a 0. Por lo tanto, B = I. Para casos más generales, la matriz B puede no 


ser la matriz identidad. 
También, se define la matriz A de 2 X 4 como 


Ja ôi ô2 Ó1 ÓL 7 
a|ar ôn ôn 9 (cIa) 


Entonces se verá que la matriz K se puede dar por 
K = BAT” 
y el vector de control u(k) puede estar dado por 
u(k) = -BAT x(k) = —BAx(k) 
Por lo tanto, la ecuación del sistema dada por el ecuación (C-8) se convierte en 
£(k + 1) = Gx(k) — ĤBAR(k) = (G — BBAX(k) 


Para el caso presente, la matriz HBA se convierte en: 


0.0 y 
A 1 0 1 0 ĝi Ín Í1 a 
HBA = 
0 JE 3 la ôn 63 ôn 
0 1 
0 0 0 0 
= 81 67 63 ôs 
0 0 0 0 
ôu ôn 83 ôn 
Por lo tanto, 
0 1 0 0 
^A Ĝĝ _|-a4— ôn an- ôn 3 — 3 —ayu — ĝu 
aa 0 0 1 


-an — & -an — n -az — s -an Ón 
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Entonces, en referencia a la ecuación (C-18), la ecuación característica |zI — G+Mó BA| se convierte 
en na 2 + +ay+8n! (au + ó4)z + a+ 8 
A o aa ea 
= [22 + (an + 812)z + an + 81][2? + (an + 82)2 + an + 8») 
= [(a + Ó14)z + a + Óp]l(an + 62)z + an + 62] 
=0 (C-20) 


Se quiere que los valores propios de G - ÁBA sean His Pz, H3 Y Ha O la ecuación característica 
deseada sea 


(z = m)(z — 4) — a) 1) = z* + a, z° + œz? + œz +a =O (C-21) 


Si se igualan los coeficientes de potencias iguales de las dos ecuaciones características, las ecuaciones 
(C-20) y (C-21), se obtienen las ecuaciones siguientes: 


an + Ó1 + anu + Ôn 


a 

an + ôn + (an + n)an + 8u) + an + ôn — (Aja + ôa)(an + ôn) = œ 
(an + n)an + ôu) + (an + Say + 873) 

= (an + ôu)(an + ôn) — (an + Sara + ôa) = a 

(an + n)an + ôn) — (a3 + 83)(a2 + ôn) = a, 


Observe que hay ocho variables $ y cuatro ecuaciones. Por lo tanto, los valores ô, 8,,, 8,3, 8,4, 8,,, 
877, 8,3, Y 0,4 no pueden ser determinados en forma única. Existen muchos conjuntos posibles de 
valores para ôn, 87, . . ., Ô y por lo tanto, la matriz A no es única. Cualquier matriz A cuyos 
elementos satisfagan las cuatro ecuaciones anteriores es aceptable. 

Una vez que la matriz Á se selecciona, la matriz de ganancia de retroalimentación del estado K 
está dada por 


K = BAT" 


y el vector de control de retroalimentación del estado es 
u(k) = -BAT x(k) 
y la ecuación de estado dada por la ecuación (C-9) se convierte en 
x(k + 1) = Gx(k) —- HBAT"' x(k) = (G — HBAT™’)x(k) 
Para continuar, observe que 
IG — HBAT”!| = |T||G — HBAT”!||T| = |T- GT — T'HBA| = |G — MBA] 


Para un conjunto de valores propios deseados ,, 4», . - . , Mp Se tiene los coeficientes corres- 
pondientes œ}, %,, . . - , œ, en la ecuación característica |z} — G + HBA|=0. Para un valor dado de a, 
A, . . ., A, es posible escoger la matriz A que no es única. (Esto significa que se tiene cierta libertad 
para satisfacer otros requerimientos, si existen.) 
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712 
Si se desea una respuesta de oscilaciones muertas, se requiere que u, = u, = H; = u, =O. La 
ecuación característica deseada dada por la ecuación (C-21) se convierte en 
Z=0 
Observe que se escoge, por ejemplo, 
—ân 74yp 4 ~a 
A = 1 12 13 14 (C-22) 
* * 74 “ay 


donde los elementos indicados por el asterisco son constantes arbitrarias, entonces G - ĤBA se 
convierte en 
0 0 0 
a a 0 0 0 
— HBA = 
G 0001 


oo 


*x xr 0 0 


donde los elementos indicados por el asterisco doble son constantes arbitrarias. 


0.000 

Á A 0 0 00 
Z J 

(G — HBA) = 0 00 

0 ** 0 0 

0.000 

A a 0000 
z 3 

(G — HBA) O + 0 0 

0.000 

dl 0000 

A À “_|J00.0 0 

(G — HBA?Y = 0000 

0000 


De esta manera, se obtiene la respuesta de oscilaciones muertas. La matriz A dada por la ecuación 
(C-22) no es única porque diferentes selecciones de elementos producirán la respuesta de oscilacio- 
nes muertas. Por lo tanto, existe más de una matriz de ganancia de retroalimentación del estado K 
que produce la respuesta de oscilaciones muertas. Esto era de esperarse, ya que hay dos señales de 
control u,(k) y ux(k) disponibles, en lugar de una sola señal de control. 

Es importante señalar que si se selecciona a 


am Tan 74 a] (C-23) 
Tân “an “lg “la 
entonces 
0100 
~ an 0000 
G — HBA = 0001 
0000 
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(G - ABAY = 0 


Por lo tanto (G -Ñ BAY se hace cero para k = 2, 3, 4, . . . La respuesta de oscilaciones muertas se 
alcanza en dos periodos de muestreo. De hecho, en general, al escoger los elementos de A en la 
manera dada por la ecuación (C-23), la respuesta de oscilaciones muertas se puede alcanzar en n 
pasos en lugar de n pasos, donde 


min 


Amin = MAX (n;,n>,...,n,) 
Ya que n, + m, +: +n, = n, se observa que npin siempre es menor que n. 
Extensión al caso más general. Se ha dado una discusión detallada para el caso donde n = 4 
(n, =n,=2) y r=2. La extensión de la discusión anterior al caso más general es directa. Por ejemplo, 
considere el caso cuando n = 6 y r = 3. Para este caso, 


m+n>+n=6 


y se tienen varias combinaciones de n, m, y My. 
Ahora considere el caso donde n, = 3, n, = 2, y n, = 1. La matriz de controlabilidad F modifi- 


cada para este caso es F = [H; : GH, | G?H; : Hz: GH, H] 


Se define 
wkk 
er Jn =3 
FA = h 
Te 
f; hn, = 1 


donde un renglón de asteriscos denota un vector renglón. Entonces la matriz de transformación T se 
puede formar como sigue: 


Ss i 
T = |S; 
S 
donde 
f, 
Oa E f» 
S, a iG > S, = Pal S; T f; 
f G? 2 
Entonces las matrices G y H tendrán las formas siguientes: 
0 1 0: 0 0 ! 0 
0 0 1:0 0:0 
& = | T2 ón 4] au ans | a 
0 0 0 0 1: 0 
Ei Ml BL DA s | ia 
Taz “an dy! Tau azs | dx 
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0.00 0 
0 0 0 
y _|1 bp by 
H = 07070 
0_1_ da 
0 0 1 


donde b =f, G’? H,, b = fi G? H,, y b,, = £, GH,. Estos valores pueden o no ser cero. (Observe que 
en la matriz G los menores principales están en la forma canónica controlable.) La matriz de ganan- 
cia de retroalimentación del estado K está dada como sigue: 


K = BAT"! 
donde 
1 bo ba dl 
B=¡0 1 bz 
0 0 1 
y 
ôn On Ó1 Ôu ôs ôi 
A =] ôn 02 ôn ôu 03 0 
ón 2 03 Ôu 035 Öz 
Observe que 00 0 000 
0.00 0 E 00 0 
e A e a 
=10 0 0 0.0 i -Jo 00 
0 1 db, 0.10 
0 0 1 0 0 1 


El efecto de postmultiplicar la matriz B por À es eliminar a b; del producto de matrices ÁB. 
Observe que si u(k) es un vector-r la forma general de la matriz B es 


1 b2 by 
o 1 be 

B=|0 0 > by (C-24) 
0 0 1 


donde las constantes b, son aquellas que aparecen en la matriz Ĥ de n X r. (Los elementos de HB 
son0o 1.) 


Ejemplo C-1 
Considere el sistema 
x(k + 1) = Gx(k) + Hu(k) 
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donde 
x(k) = vector de estado (vector-3) 
u(k) = vector de control (vector-2) 
y 
0 1 0 0 1 
G= 0 0.1 J, H=|0 0 
—0.25 0 0.5 1 0 


Se desea determinar la matriz de ganancia de retroalimentación del estado K para que la respuesta 
al estado inicial x(0) sea de oscilaciones muertas. Observe que con la retroalimentación del estado u(k) 
= -Kx(k), la ecuación del sistema se convierte en 


x(k + 1) = (G — HK)x(k) (C-25) 
Primero se examinará la matriz de controlabilidad: 


¡pop o 1 0 
=|¡0:10;1 13 0 05 -0.25 
11110110.5! —0.25 0.25 —0.125 


Es claro que, el rango de esta matriz de controlabilidad es 3. Por lo tanto, la ubicación arbitraria de los 
polos es posible. Ahora se escogen tres vectores linealmente independientes comenzando desde el lado 
izquierdo. Estos vectores se muestran encerrados entre lineas punteadas. (Los tres vectores linealmente 
independientes se escogen como H,, H,, y GH,.) Ahora se reacomodan estos tres vectores de acuerdo a 
la ecuación (C-10) y se define la matriz F como sigue: 


F = [H; : GH, : H3} 


Se observa quen, =2 y n,= 1. 
Al rescribir la matriz F, se tiene 


0.0 1 
F=|0 1 0 
105 0 
La matriz inversa de F es 
O -0.5 1 
F =]|0 1 0 
1 0 0 


Ahora se define el vector renglón n; de F! como f,, donde y, =n, y m=, +n, Yaquen,=2yn,=1, 
los vectores f, y f, son el segundo y tercer vectores renglón, respectivamente. Es decir, 


f,=(0 1 0] 
fo= [1 0 0] 


Ahora, se define la matriz de transformación T como 


donde 
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Por lo tanto, 


010 0 0 1 
T=|0 0 1 =|1 0 0 
1 0 0 010 
y 
010 
T'=|0 0 1 
100 
Con esta matriz de transformación T, se define 
x(k) = TX(k) 
Entonces TGT=G 
01.0 0 1 0 0 0 1 
=|0 0 1 0 0 1 100 
1 0 0f|¡-025 0 0.5S|j0 1 0 
01.50 
=|0 0.51 0.25 
10 i 0 
También, kA 
T'H=H 
0 1 Oo 1 0.0 
=|0 0 1|/0 0|=/1 0 
1 0 0ļj|1 0 0 1 


Ahora, se determina la matriz de ganancia de retroalimentación de estado K, donde 
K = BAT” 
De la ecuación (C-24), la matriz B para este caso es una matriz de 2 X 2. Al observar que b,,= 0, se tiene 
E 
0 1 0 1 


Para este caso, Á es una matriz de 2 X 3: 


_|ó Ón 0 
ela ô22 A 


A 


Ahora se determina la matriz G- HB 
E 9 91 ofe d ds 
0 05 -0.25|-|1 0 o ila. 8, s 
1 0 0 0 1 21 22 23 
0 1 0 0 0 0 
0 0.5 0.25 hog ôn ôi2 $1 
10 0 Ó1 Óx2 3 


ón 05-872 -—0.25 — ô 
1- $2; ~ 822 — 823 
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La ecuación característica zI- G + HBA|=0 está dada como sigue: 


z -1 0 
lzI — G + BBA| = ôn z -0.5 + z 0.25 + ôs 
-1 + 021 ôn z + 92 


=0 


Como se desea la respuesta de oscilaciones muertas, la ecuación característica deseada es 
z? =0 


Observe que la selección de las ô no es única y la matriz A no es única. Suponga que se escogen las ô tal 
que 


$1 = 0, 812 = 0.5, $13 = -0.25 
du = 1, ôn = 0, ôn = 0 
Entonces 
g E z -i 0 
|lz1 — G + HBA| = |0 z 0 =z =0 
0 0 z 








y por lo tanto 


0 05 -0.25 
afi o 0 | 


es aceptable. Entonces la matriz K se obtiene como sigue: 


010 
K= BaT" =) cl cd A 0.0 1 
100 


_[-0.25 0 05 
0 10 


Con la selección de la matriz K, (G -Ê BAY% = 0 para £ 2 nmin, donde 


ANmin = max (nı, m) = max (2,1) = 2 


De hecho, 


ooo S O0 
000 000 


ooo OO m= 


Por lo tanto, 


(G-ÁBA*=0, k=2,3,4,... 


Ob 
serve que è A BA A TGT — T' HBA = TGT- T` HKT = T(G "A HK)T 


Con referencia a la ecuación (C-25) y su solución x(k) = (G — HK} x(0), se tiene que x(k) = 0 para k= 2, 
3,4,..., ya que 
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G — HK = T(G — ĤBA)T™' 
(G - HKÖ = T(G - ÁBA)TT(G - ÊĤÂBA)T™ = T(G - ÁBAT" = 0 


x(k) = (G —- HK)}*x(0) = 0,  k=2,3,4... 


Por lo tanto, se ha diseñado la matriz de ganancia de retroalimentación del estado K para que la respuesta 
del sistema al estado inicial x(0) sea de oscilaciones muertas. El estado x(k) se puede transferir al origen 
a lo máximo en dos periodos de muestreo, [Observe que si la señal de control u(k) fuera un escalar 
entonces se podrían tomar a lo más tres periodos de muestreo, en lugar de los dos periodos de muestreo, 
para la respuesta de oscilaciones muertas.] 


PROBLEMAS DE EJEMPLO Y SOLUCIONES 


Problema C-1 
Considere el sistema dado por 
x(k + 1) = Gx(k) + H, u(k) 
donde 
x(k) = vector de estado (vector-n) 
u(k) = señal de control (escalar) 
G = matriz de n X n 


H, = matriz de n X 1 


Suponga que el sistema es de estado completamente controlable. 


Se define 
f, 
i A se f 
[H : GH, i e a] E 
fn 
donde f, (i= 1, 2, . . . , n) son vectores renglón. También se define 
f -1 
T,= sG 
fn Gr 
Muestre que 
0 1 0 .. 0 
0 0 1 . 0 
T GT =| : : : : (C-26) 
0 0 0 ©. 1 
~An nr TO “e: 74 
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0 
PRORA |: 
ds da Es (0-27) 
1 


donde a, son los coeficientes que aparecen en el polinomio característico de G, o 


IzZl—-G]|=2" + az"! +-+- + 45-12 + an 


Solución Se probarán las ecuaciones (C-26) y (C-27) para el caso donde n = 3. (Las extensión para un 
número entero positivo arbitrario n es directa.) Por lo tanto, se obtendrá que 


0 1 0 
T¡'GT,=| 0 0 1 
43 ~a —41 (C-28) 
Ya que 
fs 
T’ =| BG 
fa G? 


es posible rescribir la ecuación (C-28) como sigue: 


0 1 0 f 
TI IG=|0 0 1l tG (C-29) 
=4 —U42 A fs G? 


Ahora considere la transpuesta conjugada del lado derecho de la ecuación (C-29). Al observar que para 


sistemas físicos los coeficientes a,, a», . . . , a, del polinomio característico son reales, se tiene 
0 0 -43 
[f3 :G*f3: (GĦ f3] 1 0 -a| = [G*f3:(G*)f3:—asf3 — a,G*f3 — a(G*Y f3] 
0 1 41 


Observe que G” satisface su propia ecuación característica: 
d(G*) = (G*) + a(G*” + a,G* + a,I=0 
Por lo tanto, 


—(as1 + a,G* + a(G*)]f3 = (G*)'13 


En consecuencia, 


0 0 —43 
[153 :G*f3:(G* ES] 1 0 —a|=[G*3:(G*)f3:(G*)13] = G*[f3:G*15:(G*)15] 
0 1 -4; 


Al tomar la transpuesta conjugada de ambos lados de esta última ecuación, se obtiene 
0 1 0 fz fz 
0 0 1 fG|=|£G|G=T;¡'G 


43 Gr 74 f; G? f3 G? 
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la cual es la ecuación (C-29). Por lo tanto, se ha mostrado que la ecuación (C-28) es cierta. o 
0 1 0 
T¡'GT,=| 0 0 1 
=fá3 ~a: ~d 
A continuación se mostrará que 


0 
T;¡'H,=/0 
1 
Ya que 
fı 
(H,:GH,:G?H,] ' = f 
fs 
se obtiene 
fi 
I= fə [H, : GH, : G?H,] 
fz 
o 
100 fiH, fGH, f,G'H, 
0 1 0 5 f H, ft GH, tG’ H, 
0.01 GH, GGH, f,G?'H, 
Por lo tanto, 


fH,=0,  fiGH,=0,  f,G"H, = 1 
Al emplear estas ecuaciones, se obtiene 


f; f: H, 0 
TH =|fG|H,=| RGH, |=|0 
hG? f,G*H, 1 
Observe que la extensión de lo presentado aquí al caso de un número positivo arbitrario n se puede hacer 
fácilmente. 
Problema C-2 


Considere el sistema 


x(k + 1) = Gx(k) + Hu(k) 


donde 
x(k) = vector de estado (vector -4) 
u(k) = vector de control (vector-2) 
y 
-1 1 0.0 1 0 
A 1 -2 1 0 n : JO 0 
G= 0 1 -1 2h H=(H,:Hl=|p9 o 
1 0 01 0 1 
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Con referencia a la ecuación (C-10), se obtiene la matriz F. Entonces, al emplear la matriz de transforma- 
ción T definida por la ecuación (C-12), se determinan las matrices G = T! GT y H =T” H. Por último, 
obtenga la ecuación (C-14). 

Solución Primero se escribirá la matriz de controlabilidad como sigue: 


Es 38% as 0 als TEI ld ' 
1110111101 2 0 -5 2 
ajla loii aif opaa 2 a= 
'0! 0i! 0112 3 0 -6 4 
1011111 1iili 01 2 1 

Cadi bad Esad red 


Ahora se escogen cuatro vectores linealmente independientes de esta matriz de 4 X 8, comenzando desde 
el extremo izquierdo. (Estos vectores se muestran encerrados por líneas punteadas.) Los cuatro vectores 
linealmente independientes son H,, H). GH, y GH.. A continuación se arreglan estos cuatro vectores de 
acuerdo con la ecuación (C-10) y se define la matriz F como sigue: 


F= [H, :GH,:H>: GH) 


(Observe que en este caso n, = 22 y n, = 2.) Por lo tanto, 


1 -1 0 0 

0 100 

Eem awa 

0 1 1 1 

La inversa de esta matriz está dada por 

1 1 0 0 
_ I0 1 0 0 
Elo -ei egs] 
0 0 05 0 


Como en este caso n, = 2 y n, = 2, el segundo vector renglón de F” se define como f, y el cuarto vector 
renglón como f,. Entonces 


f=[0 1 0 0 
f.=[0 0 0.5 0] 


La matriz de transformación T está dada por 


donde 
-|f aba 
sl) s-i] 
Por lo tanto, i a 
f, 0 1 0 0 2 1-20 
T fiG _ o -2 1 0 ES 1 0 0 0 
oÈ =10 0 05 0 0 0 2 0 
£G 0 0.5 —0.5 1 -0.5 0 1 1 
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Con esta matriz de transformación T se obtiene 


o 1. o ol- 1 oof2 1-20 
A |1 -2 1 ol ı -2 ol 1 o 00 
G=T"GT=lo o osol o 1-12 l o o 20 

o os -05 1l 1 o il -0o50 11 

o 1. 00 

-1 -3 22 

0 0 01 

5 15 -1 

i 1 0 
o 1 o oliol foo 
-nan l1 -2 ı E 
H=T H=|9 o os olo ojlo o 
o os -05 illo 1l lo 1 


Observe que, cuando », = n, = 2, la matriz G tiene la forma dada por la ecuación (C-13) y la matriz á 
tiene la forma dada por la ecuación (C-14), o bien 


0 1 i0 0 0 0 
A =4u 4 Gx TA A = 1 bu 
A a Aa 
Táda an | —4a a24 0 1 


(Observe que, en este caso, b,, es cero.) 

Finalmente, se obtendrá la ecuación (C-14). Observe que 
m; 
fı 


FF (H, GH, H GH; 


m; H, m, GH, m, H: mı GH: 
fH, f£GH fiH: f,GH, 
m> H, m2 GH, mz H- m2 GH, 
CH, £GH, fH: f GH: 


donde m, y m, son el primero y tercer vector renglón de F”, respectivamente. Como F ' F es una matriz 
identidad, se tiene que f, H, = 0, f, H, = 0, fi GH, = 1, f, GH, = 0, f, H, = 0, f, H, = 0, f, GH, = 0, y f, 
GH, = 1. Por lo tanto, tenemos 


fı fı H, fı H2 0 0 
ao mig e _|f,GH, £,GH|_ [1 0 
AT u=] p En Eea GB 0.0 
£G £ GH, f: GH, 0 1 


que es la ecuación (C-14). 
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Problema C-3 
Considere el sistema definido por la ecuación (C-8): 
xk + 1) = TGTx(k) + T 'Hu(k) = Gx(k) + Mu(k) 


donde la matriz de transformación T está definida por la ecuación (C-12). Suponga que la matriz G está 
dada por la ecuación (C-15) y la matriz H está dada por la ecuación (C-16). Es decir, 


0 1 0.0 0 0 
t 
ĉ= 0 0 1 0 l Å= 0 0 
E e a a 1b 
Taa Taz Taz ! Taxa 0 1 
Muestre que 
A z? + anz +anz +a a 
- Âj = 1 14 
[Al | 432? + 4222 + 921 Zz + a4 
y 
0 1 0 0 
A A 0 0 1 0 
G — HBA = 
2447 Ón an ôn an3 — ĝi —di4 — ĝi 
=an7 n 7427-02 —az — z az — Óza 
donde 


-1 
ds 1 br eze ôn ón Ó3 ĝua 
0 1 i ôn 2 3 ĝz4 
También muestre que si se escoge, por ejemplo, 


an 74 âz $ (C-30) 


* * * — 424 


donde los elementos mostrados con asterisco son constantes arbitrarias, el sistema presentará una respuesta de 
oscilaciones muertas para cualquier estado inicial x(0); es decir, 


(G-HBA'=0, k=4,5,6,... 


También muestre que si se escoge 


ano 74 743 24] (0-31) 


Hala Tan "Mza “az 
Entonces 


(G - HBBAY = 0 
para k 2 npin donde 


Amin = max (n,, m) = max (3,1) = 3 


Solución Para el caso donde la matriz G está dada por la ecuación (C-15). se tiene 


Zm =4 0 0 
zI- rel 2 0 z -1 0 

aa An Z +43 At 

ân dz 423 Z + la 


www.FreeLibros.me 


724 Diseño por ubicación de polos cuando la señal de control es un vector 


Al expandir este determinante empleando la fórmula de expansión de Laplace, se obtiene 

















zI - 6| = E 7 E + 4 aa |_|z —-1]|-1 0 
0 z Az Z + an au Gpllaz Z + an 
+z -1 -1 0 
Aa axzliz +41 au 














= (z + az? + a132? + Arz + au) a ara(a7 2? + d22Z + a21) 
Por lo tanto, el determinante |zI — G | se puede escribir como: 








Apéndice C 


(C-32) 


a |z? + anz? + anz + 411 Aja 
|z1 cl g anz? + 422 + 021 2 + da 
Luego se calcula 
0 0 a 
A 0 0 |1 bpv 61 Ô Ó1 Ôi 
HBA = 
1 bz E 1 | P 22 023 A 
0 1 
0 0 0 0 0 0 
z 0 OJ] n Ó12 63 Ó 7 0 0 0 0 
1 0l|2 $2 62 0x4 Ôn Ôr $3 Ô 
0 1 81 1 Ôn 2 
(Observe que el efecto de postmultiplicar la matriz H por la matriz B es eliminar b, del producto H B.) 
Por lo tanto 
0 1 0 0 
A ` 0 0 1 0 
G — HBA = 
Zan ÓN anr — n ana — ôB aua- ĝia 
4x2 7 2 ~an — ôn ~az — n -an ~ ĝu 


Si se escoge A como la de la ecuación (C-30), entonces 


0100 
~ an, J0010 
G-HBA=]) 00 0 

* x * 0 


donde los elementos mostrados con asterisco son constantes arbitrarias. Observe que 


0010 
A 2_|00 0.0 
(G HBA"=l0 000 
0 kx * 0 
000.0 
AO ñ 3_10 000 
(G HBA) =o 000 
00x* 0 
0000 
a “_|00 0.0 
(G HBA =| 000 
0000 
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Por lo tanto, 
x(k) = (G — HK)x(0) = T(G - HBA)*T"'x(0)=0,  k=4 
Se ha visto que la respuesta de oscilaciones muertas se alcanza al escoger Á como la dada por la ecuación 
(C-30). 
Sin embargo, si se escoge Á como la de la ecuación (C-31), entonces la respuesta de oscilaciones 
muertas se puede alcanzar en a lo más tres periodos de muestreo, porque los asteriscos que aparecen en 
(G - H BA” se convierten en cero y 


x(k) = T(G —- ABBA TU x(0)=0,  k=nmn=3 
Problema C-4 


Considere el sistema siguiente: 
x(k + 1) = Gx(k) + Hu(k) 


donde 
x(k) = vector de estado (vector-4) 
u(k) = vector de control (vector-2) 
y 
-1 1 00 0 1 
_ 1-2 10 a : [1.0 
G= 0 1-1 2 H = (H,:H.] = 0.0 
1 0 0 1 1 0 


Al emplear el control por retroalimentación del estado u(k) = -Kx(k), se desea ubicar los polos de lazo 
cerrado en los siguientes puntos: 


zı = 0.5 + j0.5, z2 = 0.5 — j0.5 
z3 = —0.2, z4 = -0.8 


Determine la matriz de ganancia de retroalimentación del estado K requerida. Entonces, mediante las 
matrices G y H dadas, obtenga la ecuación (C-16). 


Solución Primero se examinará la matriz de controlabilidad: 
[H : GH : G°H £ G*H] = (H, : H: : GH, : GH>: G°H, : G? H, £ G° H, | G° H3] 


roni 1) 1 3i 2 n -=s 

{i1101 —-2! 1 ! 8} -3 -2 11 

Sjrorioii 31 0 i3} 3 15 —6 (C-33) 
or 1! 1 !2! 0 -1 2 


El rango de esta matriz de controlabilidad es 4. Por lo tanto, la ubicación arbitraria de polos es posible. Se 
escogen cuatro vectores linealmente independientes comenzando desde el extremo izquierdo. (Estos 
vectores se muestran encerrados en líneas punteadas.) Los cuatro vectores linealmente independientes se 
escogen como H,. H,, GH, y G?H.. Ahora estos cuatro vectores se rearreglan de acuerdo con la ecuación 
(C-10) y la matriz F se define como sigue: 


F= [H; : GH; : G’ H; : H3] 


Se observa que, en este caso, n, = 3 y n, = 1. Al rescribir la matriz F, se tiene 


0 1-3 1 
la -2:80|_faiB 
ES 3530 [e 
1 1120 
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Luego, se calcula F`. Con referencia al apéndice A, se tiene 


pis i +A"B(D - CA "B) "CA? -A-'B(D — A 


-(D ~- CA™'B) CA~! (D - CA “'B)* 
0 -1 -4 2 
0 j 3 z 
1 3 j 


(El mismo resultado se puede obtener fácilmente con MATLAB.) Como n, = 3 y n, = 1, se escoge el 
tercer vector como f, y el cuarto como f,. (Observe que el vector renglón se define como n; donde y, = 
ntm ++ + +n, como f.) Es decir, 


t=/0 34 Y 
L=1134 3 
La matriz de transformación T se define como 
=i 
-|S 
El 
donde 
f, 
S=] 6G , S, = [f] 
f, G* ` 
Por lo tanto, 
oO 1 24 a|? |-11.0 1 
Tae 03 0 $ 0 1010 
0 2 — 3 3300 
1 Z 4 -4 1 310 
Con esta matriz de transformación T, si se define 
x(k) = TxX(k) 
entonces 
0 1 0:10 
a 0 0 1:0 
= p~! Z = 
G=T GT E (C-34) 
2 0 0 i—i 
También 
0 3 3-4 [0 1 0.0 
a m-ig 3 0 3ff1 0/_/0 0, E 
H=T H= 0 2 illo o 10 (C-35) 
1 3 3 3/1 0 0 1 


Ahora se determina la matriz de ganancia de retroalimentación del estado K, donde 
K = BAT * 
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Con referencia a la ecuación (C-24) y al notar que, en este caso, b,,= 0, la matriz B es una matriz de 2 xX 


2 dada por 
-1 
_|1 bp _J1 0 
MODA cw 


Para este caso, A es una matriz de 2 X 4: 


A= Ó11 12 613 ĝia 
2 Ó22 823 Ó24 


Por lo tanto 
0 1 0 0 
A R E 0 0 1 l 0 
G-ĦBA=] ap 3-88 2-89 18 
2 — ôn —Ón =823 !—1 — Óx 


Con referencia a la ecuación (C-32), se tiene 


a a z? + (2 + 813)2? + (-3 + 812) + ôi: aan 
ES TN A A E A E = 
la $3 2* + 272 + (2 + 621) Iz + 1+ 82 9 


Esta ecuación característica debe ser igual a la ecuación caracteristica deseada, que es 


r EE 


(z — 0.5 — j0.5)(z — 0.5 + j0.S)(z + 0.2)(z + 0.8) = z* — 0.342? + 0.34z + 0.08 = 0 
Si se igualan los coeficientes de potencias iguales de z de las dos ecuaciones caracteristicas. se tendrán 


cuatro ecuaciones para determinar las ocho ô. Por lo tanto, la matriz A no es única. Suponga que se 
escogen en forma arbitraria 


ôu = 0, ôn = 0, ôn = 0, ôn = -1 


Entonces 
|zI — Ĝ + MBA] = 2* + (2 + &3)z2? + (-3 + 812)2? + 812 -2+ 87 =0 


Al igualar la ecuación característica con la ecuación característica deseada, se tiene 


61 = 0.34 
612 = 2.66 
ôn = -2 

$21 = 2.08 


Por lo tanto, 
A= 0.34 2.66 -2 0 
2.08 0 0 -1 
Entonces la matriz K se obtiene como sigue: 


0 -2.1067 0.7800 ed 


Z ai 
EaR E 0.02667 0.3600  —0.02667 


Con esta matriz K, el control por retroalimentación del estado 
u(k) = -Kx(k) 
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colocará los polos de lazo cerrado en z, = 0.5 +/0.5, z, = 0.5 ~ j0.5, z3 = —0.2 y 2,=-0.8. Se observa que 
la matriz K no es única: existen muchas posibles matrices para K. 
Por último. se obtiene la ecuación (C-16). Observe que 


m; 
F`'F= r [H, GH, GH, H 

1 
f 
m, H, m, GH, m, GH, m, H- 1000 

= m- H, m, GH, m> GH, m, H- 2 0 1 0 0 
fiH, f£GH AGH, fiH: 0010 
fH £GH f,.G'H, fH: 0001 


donde m; y m, son el primero y segundo vectores renglón de F, respectivamente. Como F”! F es la 
matriz identidad, f, H,=0,f, H,=0,f, GH,=0,f, G"H,=1,f,H,=0yf, H, = 1. De la ecuación (C- 
33) se observa que GH, es linealmente dependiente de H,, H,. y GH,. Por lo tanto, f, GH, = af, H, + Bf, 
H, + yf, GH, = 0, donde a, B, y y son constantes. Observe que f, G? H, puede o no ser cero. En 
consecuencia. 


f fiH, fı H2 0 0 
7 = TT! = fı G = f; GH, f, GH: 0 0 
EA f, G? (HH f,G'H, fiC’ H, 1 bv 

f £H, f H- 0 1 


donde bp = f, G? H}. Esta última ecuación es la ecuación (C-16). 
Problema C-5 


Con referencia al problema C-4. considere el mismo sistema. Suponga que se desea una respuesta de 
oscilaciones muertas para un estado inicial arbitrario x(0). Determine la matriz de ganancia de retro- 
alimentación del estado K. 


Solución Con referencia a las ecuaciones (C-34), (C-35), y (C-36), se tiene 


01 010 0.0 
a lo0 1!0 4 _ [00 
lo ae PARO 
20 0 1-1 0 1 


donde b,, es cero. Para la respuesta de oscilaciones muertas, se escoge A como sigue: 


A= >an 4 4 -G4|_|0 3 -2 1 
Tan anz “anz azn 2 0 0 -1 


donde a, se definen como en la ecuación (C-15). Entonces 


G - BA = 


oooo 
ooo 
Oo- o 
Oooo 


y se encuentra 
(Ĝ - ĤBA)}* = 0, k=3,4,5,... 


www.FreeLibros.me 


Apéndice C Problemas de ejemplo y soluciones 729 


La respuesta de oscilaciones muertas se alcanza en a lo más tres periodos de muestreo. [Observe que en 
este problema rn, = 3 y m = 1. Por lo tanto, Amin = max (7n, 2-2) =3.] La matriz de ganancia de 
retroalimentación del estado K se obtiene como sigue: 

K = BAT ' 


0 3 3 
_|rofo 3 -2 ılo — 0 2 
{o0 afjfa.o o -ijjo 2-1 4 

1103037 


[1i -1 4 
-1 04 0 


Con esta matriz K, el control por retroalimentación del estado 


u(k) = -Kx(k) 


colocará los polos de lazo cerrado en el origen y, por lo tanto, producirá la respuesta de oscilaciones 
muertas para cualquier estado inicial x(0). 
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